Documentation Index
Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
Use this file to discover all available pages before exploring further.
1. Modellnutzung & Sicherheit
Speichert AIHubMix die Daten von API-Anfragen der Nutzer?
Standardmäßig speichert AIHubMix keinerlei Anfrageinhalte, die Sie über unsere API senden, und protokolliert auch keine von den Modellanbietern zurückgegebenen Antworten. AIHubMix fungiert ausschließlich als Proxy, der Ihre Anfrage sicher an den entsprechenden Modellanbieter weiterleitet und dessen Antwort unverändert an Sie zurückgibt.Die einzige Ausnahme
Wenn Sie aktiv ein Problem melden, ein Fehlerticket einreichen oder Hilfe beim Debugging anfordern, kann AIHubMix vorübergehend technische fehlerbezogene Informationen (wie Stack Traces, Aufruf-Metadaten oder Endpunkt-Status) speichern, um uns bei der Diagnose und Behebung des Problems zu unterstützen.Diese Protokolle enthalten keine Geschäftsdaten, Prompt-Inhalte oder die vollständige Anfrage-/Antwort-Payload.
Warum liefern offizielle Produkte wie Claude oder GPT andere Ergebnisse als die API?
Das zugrunde liegende Modell ist dasselbe; der Unterschied liegt in den zusätzlichen Engineering-Optimierungen der Web-Version. Erklärung:- Die Web-Version ist wie eine vollständig möblierte Wohnung mit eingebauten Funktionen wie Suche, Gedächtnis, Taschenrechner und System-Prompts.
- API-Aufrufe sind wie eine unfertige Wohnung, die nur die Kernfunktionen bereitstellt. Entwickler müssen Kontext und Werkzeuge selbst konfigurieren.
Warum kann die Verwendung von GPT-5- oder „o”-Serie-Modellen zu einer Sperrung des AiHubMix-Kontos führen?
Wenn Sie GPT-5- oder „o”-Serie-Modelle auffordern, „Denkschritte anzuzeigen”, „Gedankenketten darzustellen” oder „Reasoning-Traces” zu zeigen, kann das System Sicherheitsrichtlinien auslösen, was Ihr Konto vorübergehend einschränken oder sperren kann. Erklärung:- Die offiziellen Sicherheitsrichtlinien für GPT-5 und „o”-Serie-Modelle sind strenger; normale Nutzung führt nicht zu einer Sperrung.
- Falls Ihr Konto fälschlicherweise markiert wurde oder Sie anomale Nachrichten sehen, kontaktieren Sie den Support per E-Mail unter feedback@aihubmix.com für Unterstützung.
- Um Reasoning-Zusammenfassungen des Modells anzuzeigen, verwenden Sie die Response API anstatt das Modell direkt im Prompt zu fragen, um das Auslösen von Sicherheitsrichtlinien zu vermeiden.
Was tun, wenn Ihr Konto deaktiviert wurde?
Wenn Ihr Konto deaktiviert wurde, können Sie den Online-Kundenservice kontaktieren oder eine E-Mail an feedback@aihubmix.com senden, um Unterstützung oder die Wiederherstellung Ihres Kontos anzufordern. Kontosperrungen werden in der Regel automatisch durch die Risikokontrollmechanismen des Systems ausgelöst. Häufige Gründe fallen in die folgenden zwei Kategorien:-
Verwendung von GPT-5-Serien-Modellen in Szenarien für immersive Übersetzung
Diese Modellreihe ist für komplexes Reasoning und strukturierte Inhaltserstellung konzipiert und daher ungeeignet für hochfrequente Echtzeit-Übersetzungsaufgaben. Häufige Aufrufe in solchen Szenarien können die Risikokontrollrichtlinien des Systems auslösen und zu temporären Einschränkungen oder Kontosperrungen führen. Um den stabilen Betrieb Ihres Kontos zu gewährleisten, verwenden Sie bevorzugt Nicht-Reasoning-Modelle für Übersetzungsaufgaben, wie zum Beispiel:
gpt-4.1-minigpt-4o-mini
- Senden verstoßender Inhalte bei der Verwendung des Grok-Modells Wenn der angefragte Inhalt während der Nutzung des Grok-Modells vom System als Verstoß gegen die Nutzungsbedingungen eingestuft wird (z. B. wegen Gewalt, blutiger Inhalte, Pornografie usw.), löst dies direkt den Sperrmechanismus aus. Stellen Sie bitte sicher, dass Ihre Anfrageinhalte den Richtlinien der Plattform und des Modells entsprechen, um das Senden illegaler oder unangemessener Inhalte zu vermeiden.
Warum kann mein Konto bestimmte Modelle (wie Claude Opus oder GPT-5.4-Pro) immer noch nicht aufrufen, obwohl Guthaben vorhanden ist?
Wir verwenden einen Vorabbuchungsmechanismus. Beim Aufruf kostenintensiverer Modelle (wie Claude Opus oder GPT-5.4-Pro) schätzt das System die maximal möglichen Ausgabekosten basierend auf dem konfigurierten Output-Token-Limit und prüft Ihren Kontostand bei Initiierung der Anfrage. Wenn Ihr Kontostand kleiner ist als der Output-Token-Preis × maximale Output-Tokens, kann die Anfrage abgelehnt werden. Um dies zu vermeiden, stellen Sie sicher, dass Ihr Kontostand vor dem Aufruf dieser Modelle ausreichend ist, und setzen Sie ein angemessenes maximales Output-Token-Limit; wird keines angegeben, verwendet das System den Standardwert zur Schätzung. Beachten Sie, dass der Parametername für das Maximum je nach Modell unterschiedlich ist: Claude- und GPT-Modelle verwendenmax_tokens, während Gemini-Modelle max_output_tokens verwenden.
Warum wird GPT-5 nicht für Übersetzungswerkzeuge empfohlen?
GPT-5 ist ein Reasoning-Modell, das für komplexes Schlussfolgern und strukturierte Generierung konzipiert ist, nicht für hochfrequente Echtzeitaufgaben. Gründe:- Langsamere Antwortzeiten aufgrund mehrerer Inferenzschritte.
- Höherer Token-Verbrauch (lange System-Prompts und Reasoning-Kontext).
- Übersetzungs-Plugins können versehentlich Sicherheitsrichtlinien auslösen.
Warum antwortet GPT-5 auf die Frage „Wer bist du?” manchmal mit „Ich bin GPT-4”?
Dies ist eine bekannte LLM-Halluzination, bei der das Modell seine eigene Grundlage, Quelle oder Fähigkeiten ungenau beschreibt. Entwickler, die GPT-4, GPT-5, Claude usw. verwenden, können auf selbstsichere, aber falsche Selbstidentifizierungen stoßen. Erklärung:- Dieses Verhalten ist nicht auf Plattform-Modifikationen oder Ausgabemanipulationen zurückzuführen; es ist normal für LLMs.
- GPT-5 wurde während des Trainings nicht der Name „GPT-5” gegeben; der Name wurde nachträglich durch die offizielle Veröffentlichung vergeben.
- Das Modell kennt seinen eigenen Namen oder seinen Wissensstichtag nicht; die Web-Version kann korrekt antworten, weil sie eingebaute System-Prompts hat. Unsere API-Version ist die offizielle Nicht-Web-API.
- Direktes Fragen über die API kann zufällige oder ungenaue Antworten erzeugen, weil dem Modell Selbstbewusstsein fehlt.
Was tun, wenn Aufrufe an einige Modelle (wie Gemini-3-Pro) häufig in Timeouts enden?
Versuchen Sie, die Timeout-Dauer zu erhöhen. Gemini-3-Pro ist ein großes Modell, und sein Inferenzprozess erfordert oft eine längere Denkzeit – insbesondere bei komplexen Aufgaben, bei denen die Antwort mehr als 30 Sekunden dauern kann. Daher kann der Standard-Timeout von 30 Sekunden leicht zu Fehlern führen.- Wenn Sie Gemini-3-Pro verwenden müssen, verlängern Sie unbedingt den Timeout entsprechend.
- Wenn schnelle Antwortzeiten essenziell sind, ziehen Sie den Wechsel zu einem leichteren Modell wie Gemini 2.0 in Betracht, das mit kürzeren Timeout-Einstellungen besser funktioniert.
Warum hat das Senden von nur „Hallo” so viele Tokens verbraucht?
Einige Drittanbieter-Tools (wie Cline oder Claude Code) fügen automatisch Kontext oder System-Prompts in Anfragen ein, die ebenfalls auf den Token-Verbrauch angerechnet werden. Auch wenn Sie nur „Hallo” eingeben, kann die Backend-Anfrage einen umfangreichen Chatverlauf oder voreingestellten Text enthalten. Diese zusätzlichen Tokens stammen vom Tool, nicht von der AiHubMix-Plattform.Warum sehe ich 4o-mini-Nutzung, obwohl ich nur GPT-4o aufgerufen habe?
Einige Drittanbieter-Tools rufen möglicherweise leichtgewichtige Modelle (wie 4o-mini) zur Konversationszusammenfassung, Suche oder Hilfsberechnung auf.Daher kann Ihre Rechnung oder Ihr Protokoll die Token-Nutzung mehrerer Modelle anzeigen. Diese zusätzliche Nutzung stammt aus den Tool-Konfigurationen, nicht aus einem automatischen Modellwechsel durch AiHubMix.
Wie hoch ist das Concurrency-Limit für API-Anfragen?
AiHubMix erzwingt derzeit kein einheitliches Concurrency-Limit. Kontaktieren Sie den Support unter feedback@aihubmix.com, falls Sie auf Concurrency-Probleme stoßen.Warum variieren die Ergebnisse bei demselben Prompt?
Große Sprachmodelle verwenden probabilistisches Sampling (z. B. temperature, top-p), um Text zu generieren, und wählen jedes Mal zufällig aus mehreren möglichen Tokens.- Eine niedrigere Temperatur oder das Deaktivieren des Samplings kann die Ergebnisse konsistenter machen.
- Variationen können auch durch Kontext, System-Prompts oder Netzwerkbedingungen beeinflusst werden.
Warum enden Antworten vom Claude-Modell vorzeitig?
Für das Claude-Modell unterstützt AIHubMix derzeit zwei Aufrufmethoden:- OpenAI Chat-kompatible Schnittstelle
- Anthropic Claude-native Schnittstelle
2. API-Aufrufe & Daten
Welche API-Endpunkte sind verfügbar?
AiHubMix stellt ein einheitliches Gateway bereit, das mit mehreren gängigen Modellstandards kompatibel ist:- OpenAI-Standard-Endpunkt:
https://aihubmix.com/v1(unterstützt GPT und kompatible Modelle) - Gemini-spezialisierter Endpunkt:
https://aihubmix.com/gemini(kompatibel mit nativen Google-Standards) - Claude-Auto-Forwarding-Endpunkt:
https://aihubmix.com(unterstützt Anthropic SDK-Aufrufe)
Welche Daten werden während der API-Nutzung aufgezeichnet?
Wir protokollieren nur notwendige Nutzungsdaten: Kontoinformationen, Aufrufprotokolle, verwendete Modelle, Token-Verbrauch und Zahlungsinformationen. Datenschutzgarantie:- Benutzereingaben und Modellausgaben werden nicht gespeichert.
- Daten werden ausschließlich für die Abrechnung und Dienstoptimierung verwendet, nicht für Inhaltsanalysen oder die Weitergabe an Dritte.
- AiHubMix speichert keine detaillierten Anfragedaten; die zugrunde liegenden Cloud-Anbieter können jedoch Zugriffe für Sicherheits- oder Compliance-Zwecke protokollieren, was deren Datenschutzrichtlinien unterliegt.
3. Modellwissen & häufige Phänomene
Was sind KI-Halluzinationen?
KI-Halluzinationen treten auf, wenn ein großes Sprachmodell Informationen generiert, die faktisch inkorrekt, nicht belegt oder völlig fiktiv sind. Mögliche Ursachen:- Verzerrungen oder Lücken in den Trainingsdaten.
- Overfitting der Modellparameter.
- Zufälligkeit während der Generierung.
4. Nutzung & Fehlerbehebung
Wie kann ich die API-Nutzung und den Verbrauch überwachen?
Sie können das Anfragevolumen, den Token-Verbrauch und Abrechnungsdetails über das AiHubMix-Dashboard einsehen. Unterstützt die Kategorisierung nach Modell und Zeitraum und hilft so bei der Nutzungsoptimierung und Kostenkontrolle.Was soll ich tun, wenn ein Aufruf fehlschlägt oder einen Fehler zurückgibt?
API-Fehler enthalten einen Fehlercode und eine Erklärung. Häufige Ursachen:- Fehlerhaftes Anfrageformat.
- Modell nicht verfügbar oder Nutzungslimit überschritten.
Wie verwalte ich meinen API-Schlüssel?
Benutzer können API-Schlüssel über das Dashboard generieren, widerrufen oder aktualisieren.- Geben Sie API-Schlüssel nicht in öffentlichen Umgebungen preis.
- Verwenden Sie separate Schlüssel für verschiedene Projekte.
- Rotieren Sie die Schlüssel regelmäßig, um die Kontosicherheit zu gewährleisten.
Zuletzt aktualisiert: 2026-06-01