Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

1. Modellnutzung & Sicherheit

Speichert AIHubMix die Daten von API-Anfragen der Nutzer?

Standardmäßig speichert AIHubMix keinerlei Anfrageinhalte, die Sie über unsere API senden, und protokolliert auch keine von den Modellanbietern zurückgegebenen Antworten. AIHubMix fungiert ausschließlich als Proxy, der Ihre Anfrage sicher an den entsprechenden Modellanbieter weiterleitet und dessen Antwort unverändert an Sie zurückgibt.

Die einzige Ausnahme

Wenn Sie aktiv ein Problem melden, ein Fehlerticket einreichen oder Hilfe beim Debugging anfordern, kann AIHubMix vorübergehend technische fehlerbezogene Informationen (wie Stack Traces, Aufruf-Metadaten oder Endpunkt-Status) speichern, um uns bei der Diagnose und Behebung des Problems zu unterstützen.
Diese Protokolle enthalten keine Geschäftsdaten, Prompt-Inhalte oder die vollständige Anfrage-/Antwort-Payload.

Warum liefern offizielle Produkte wie Claude oder GPT andere Ergebnisse als die API?

Das zugrunde liegende Modell ist dasselbe; der Unterschied liegt in den zusätzlichen Engineering-Optimierungen der Web-Version. Erklärung:
  • Die Web-Version ist wie eine vollständig möblierte Wohnung mit eingebauten Funktionen wie Suche, Gedächtnis, Taschenrechner und System-Prompts.
  • API-Aufrufe sind wie eine unfertige Wohnung, die nur die Kernfunktionen bereitstellt. Entwickler müssen Kontext und Werkzeuge selbst konfigurieren.

Warum kann die Verwendung von GPT-5- oder „o”-Serie-Modellen zu einer Sperrung des AiHubMix-Kontos führen?

Wenn Sie GPT-5- oder „o”-Serie-Modelle auffordern, „Denkschritte anzuzeigen”, „Gedankenketten darzustellen” oder „Reasoning-Traces” zu zeigen, kann das System Sicherheitsrichtlinien auslösen, was Ihr Konto vorübergehend einschränken oder sperren kann. Erklärung:
  • Die offiziellen Sicherheitsrichtlinien für GPT-5 und „o”-Serie-Modelle sind strenger; normale Nutzung führt nicht zu einer Sperrung.
  • Falls Ihr Konto fälschlicherweise markiert wurde oder Sie anomale Nachrichten sehen, kontaktieren Sie den Support per E-Mail unter feedback@aihubmix.com für Unterstützung.
  • Um Reasoning-Zusammenfassungen des Modells anzuzeigen, verwenden Sie die Response API anstatt das Modell direkt im Prompt zu fragen, um das Auslösen von Sicherheitsrichtlinien zu vermeiden.

Was tun, wenn Ihr Konto deaktiviert wurde?

Wenn Ihr Konto deaktiviert wurde, können Sie den Online-Kundenservice kontaktieren oder eine E-Mail an feedback@aihubmix.com senden, um Unterstützung oder die Wiederherstellung Ihres Kontos anzufordern. Kontosperrungen werden in der Regel automatisch durch die Risikokontrollmechanismen des Systems ausgelöst. Häufige Gründe fallen in die folgenden zwei Kategorien:
  1. Verwendung von GPT-5-Serien-Modellen in Szenarien für immersive Übersetzung Diese Modellreihe ist für komplexes Reasoning und strukturierte Inhaltserstellung konzipiert und daher ungeeignet für hochfrequente Echtzeit-Übersetzungsaufgaben. Häufige Aufrufe in solchen Szenarien können die Risikokontrollrichtlinien des Systems auslösen und zu temporären Einschränkungen oder Kontosperrungen führen. Um den stabilen Betrieb Ihres Kontos zu gewährleisten, verwenden Sie bevorzugt Nicht-Reasoning-Modelle für Übersetzungsaufgaben, wie zum Beispiel:
    • gpt-4.1-mini
    • gpt-4o-mini
  2. Senden verstoßender Inhalte bei der Verwendung des Grok-Modells Wenn der angefragte Inhalt während der Nutzung des Grok-Modells vom System als Verstoß gegen die Nutzungsbedingungen eingestuft wird (z. B. wegen Gewalt, blutiger Inhalte, Pornografie usw.), löst dies direkt den Sperrmechanismus aus. Stellen Sie bitte sicher, dass Ihre Anfrageinhalte den Richtlinien der Plattform und des Modells entsprechen, um das Senden illegaler oder unangemessener Inhalte zu vermeiden.
Wenn Sie auf eine fälschliche Sperrung oder ungewöhnliche Einschränkungen stoßen, können Sie über den Kundenservice oder per E-Mail Einspruch einlegen. Beachten Sie jedoch, dass wenn Ihr Konto mehrfach Sperrungen auslöst, eine Wiederherstellung möglicherweise nicht mehr möglich ist.
Wenn Sie Entwickler sind, können Sie die Moderation API von AIHUBMIX verwenden, um Eingaben vor dem Senden von Anfragen auf Konformität zu prüfen und so das Risiko von Verstößen zu reduzieren. Dieser Schritt ist optional, wird aber dringend empfohlen in Szenarien, in denen Inhalte offen oder Benutzereingaben unkontrollierbar sind.

Warum kann mein Konto bestimmte Modelle (wie Claude Opus oder GPT-5.4-Pro) immer noch nicht aufrufen, obwohl Guthaben vorhanden ist?

Wir verwenden einen Vorabbuchungsmechanismus. Beim Aufruf kostenintensiverer Modelle (wie Claude Opus oder GPT-5.4-Pro) schätzt das System die maximal möglichen Ausgabekosten basierend auf dem konfigurierten Output-Token-Limit und prüft Ihren Kontostand bei Initiierung der Anfrage. Wenn Ihr Kontostand kleiner ist als der Output-Token-Preis × maximale Output-Tokens, kann die Anfrage abgelehnt werden. Um dies zu vermeiden, stellen Sie sicher, dass Ihr Kontostand vor dem Aufruf dieser Modelle ausreichend ist, und setzen Sie ein angemessenes maximales Output-Token-Limit; wird keines angegeben, verwendet das System den Standardwert zur Schätzung. Beachten Sie, dass der Parametername für das Maximum je nach Modell unterschiedlich ist: Claude- und GPT-Modelle verwenden max_tokens, während Gemini-Modelle max_output_tokens verwenden.

Warum wird GPT-5 nicht für Übersetzungswerkzeuge empfohlen?

GPT-5 ist ein Reasoning-Modell, das für komplexes Schlussfolgern und strukturierte Generierung konzipiert ist, nicht für hochfrequente Echtzeitaufgaben. Gründe:
  1. Langsamere Antwortzeiten aufgrund mehrerer Inferenzschritte.
  2. Höherer Token-Verbrauch (lange System-Prompts und Reasoning-Kontext).
  3. Übersetzungs-Plugins können versehentlich Sicherheitsrichtlinien auslösen.
Verwenden Sie für Übersetzungs- oder Chat-Szenarien leichtgewichtige Modelle wie GPT-4o mini oder Gemini für schnellere und stabilere Antworten.

Warum antwortet GPT-5 auf die Frage „Wer bist du?” manchmal mit „Ich bin GPT-4”?

Dies ist eine bekannte LLM-Halluzination, bei der das Modell seine eigene Grundlage, Quelle oder Fähigkeiten ungenau beschreibt. Entwickler, die GPT-4, GPT-5, Claude usw. verwenden, können auf selbstsichere, aber falsche Selbstidentifizierungen stoßen. Erklärung:
  • Dieses Verhalten ist nicht auf Plattform-Modifikationen oder Ausgabemanipulationen zurückzuführen; es ist normal für LLMs.
  • GPT-5 wurde während des Trainings nicht der Name „GPT-5” gegeben; der Name wurde nachträglich durch die offizielle Veröffentlichung vergeben.
  • Das Modell kennt seinen eigenen Namen oder seinen Wissensstichtag nicht; die Web-Version kann korrekt antworten, weil sie eingebaute System-Prompts hat. Unsere API-Version ist die offizielle Nicht-Web-API.
  • Direktes Fragen über die API kann zufällige oder ungenaue Antworten erzeugen, weil dem Modell Selbstbewusstsein fehlt.

Was tun, wenn Aufrufe an einige Modelle (wie Gemini-3-Pro) häufig in Timeouts enden?

Versuchen Sie, die Timeout-Dauer zu erhöhen. Gemini-3-Pro ist ein großes Modell, und sein Inferenzprozess erfordert oft eine längere Denkzeit – insbesondere bei komplexen Aufgaben, bei denen die Antwort mehr als 30 Sekunden dauern kann. Daher kann der Standard-Timeout von 30 Sekunden leicht zu Fehlern führen.
  • Wenn Sie Gemini-3-Pro verwenden müssen, verlängern Sie unbedingt den Timeout entsprechend.
  • Wenn schnelle Antwortzeiten essenziell sind, ziehen Sie den Wechsel zu einem leichteren Modell wie Gemini 2.0 in Betracht, das mit kürzeren Timeout-Einstellungen besser funktioniert.

Warum hat das Senden von nur „Hallo” so viele Tokens verbraucht?

Einige Drittanbieter-Tools (wie Cline oder Claude Code) fügen automatisch Kontext oder System-Prompts in Anfragen ein, die ebenfalls auf den Token-Verbrauch angerechnet werden. Auch wenn Sie nur „Hallo” eingeben, kann die Backend-Anfrage einen umfangreichen Chatverlauf oder voreingestellten Text enthalten. Diese zusätzlichen Tokens stammen vom Tool, nicht von der AiHubMix-Plattform.

Warum sehe ich 4o-mini-Nutzung, obwohl ich nur GPT-4o aufgerufen habe?

Einige Drittanbieter-Tools rufen möglicherweise leichtgewichtige Modelle (wie 4o-mini) zur Konversationszusammenfassung, Suche oder Hilfsberechnung auf.
Daher kann Ihre Rechnung oder Ihr Protokoll die Token-Nutzung mehrerer Modelle anzeigen.
Diese zusätzliche Nutzung stammt aus den Tool-Konfigurationen, nicht aus einem automatischen Modellwechsel durch AiHubMix.

Wie hoch ist das Concurrency-Limit für API-Anfragen?

AiHubMix erzwingt derzeit kein einheitliches Concurrency-Limit. Kontaktieren Sie den Support unter feedback@aihubmix.com, falls Sie auf Concurrency-Probleme stoßen.

Warum variieren die Ergebnisse bei demselben Prompt?

Große Sprachmodelle verwenden probabilistisches Sampling (z. B. temperature, top-p), um Text zu generieren, und wählen jedes Mal zufällig aus mehreren möglichen Tokens.
  • Eine niedrigere Temperatur oder das Deaktivieren des Samplings kann die Ergebnisse konsistenter machen.
  • Variationen können auch durch Kontext, System-Prompts oder Netzwerkbedingungen beeinflusst werden.

Warum enden Antworten vom Claude-Modell vorzeitig?

Für das Claude-Modell unterstützt AIHubMix derzeit zwei Aufrufmethoden:
  1. OpenAI Chat-kompatible Schnittstelle
  2. Anthropic Claude-native Schnittstelle
Beim Aufruf des Claude-Modells über die OpenAI Chat-kompatible Schnittstelle setzt das System standardmäßig max_tokens=4096. Wenn in der Anfrage kein größerer max_tokens-Wert explizit gesetzt wird, stoppt das Modell die Ausgabe automatisch, sobald dieses Limit erreicht ist. Daher liegt das Auftreten von „Antworten, die vor dem Ende abbrechen” in der Regel nicht an einer Modellfehlfunktion, sondern daran, dass die Standard-Ausgabelängenbegrenzung erreicht wurde. Wie generiert man längere Texte? Unter der OpenAI Chat-kompatiblen Schnittstelle können Sie den max_tokens-Parameter manuell auf einen größeren Wert setzen, zum Beispiel:
completion = client.chat.completions.create(
  model="claude-sonnet-4-6",
  max_tokens=6000,
  messages=[
    {
      "role": "assistant",
      "content": "Always respond in Chinese"
    },
    {
      "role": "user",
      "content": "What is the meaning of life?, over 6000 words"
    }
  ]
)
max_tokens darf das maximal unterstützte Limit des entsprechenden Modells nicht überschreiten. Wenn nach der Einstellung weiterhin Trunkierung auftritt, geben Sie bitte den Modellnamen und die vollständigen Anfrageparameter zur weiteren Untersuchung an.

2. API-Aufrufe & Daten

Welche API-Endpunkte sind verfügbar?

AiHubMix stellt ein einheitliches Gateway bereit, das mit mehreren gängigen Modellstandards kompatibel ist:
  • OpenAI-Standard-Endpunkt: https://aihubmix.com/v1 (unterstützt GPT und kompatible Modelle)
  • Gemini-spezialisierter Endpunkt: https://aihubmix.com/gemini (kompatibel mit nativen Google-Standards)
  • Claude-Auto-Forwarding-Endpunkt: https://aihubmix.com (unterstützt Anthropic SDK-Aufrufe)

Welche Daten werden während der API-Nutzung aufgezeichnet?

Wir protokollieren nur notwendige Nutzungsdaten: Kontoinformationen, Aufrufprotokolle, verwendete Modelle, Token-Verbrauch und Zahlungsinformationen. Datenschutzgarantie:
  • Benutzereingaben und Modellausgaben werden nicht gespeichert.
  • Daten werden ausschließlich für die Abrechnung und Dienstoptimierung verwendet, nicht für Inhaltsanalysen oder die Weitergabe an Dritte.
  • AiHubMix speichert keine detaillierten Anfragedaten; die zugrunde liegenden Cloud-Anbieter können jedoch Zugriffe für Sicherheits- oder Compliance-Zwecke protokollieren, was deren Datenschutzrichtlinien unterliegt.
Siehe AiHubMix-Datenschutzerklärung für Details.

3. Modellwissen & häufige Phänomene

Was sind KI-Halluzinationen?

KI-Halluzinationen treten auf, wenn ein großes Sprachmodell Informationen generiert, die faktisch inkorrekt, nicht belegt oder völlig fiktiv sind. Mögliche Ursachen:
  • Verzerrungen oder Lücken in den Trainingsdaten.
  • Overfitting der Modellparameter.
  • Zufälligkeit während der Generierung.
Halluzinationen sind allen LLMs gemein und deuten nicht auf einen Systemfehler hin.

4. Nutzung & Fehlerbehebung

Wie kann ich die API-Nutzung und den Verbrauch überwachen?

Sie können das Anfragevolumen, den Token-Verbrauch und Abrechnungsdetails über das AiHubMix-Dashboard einsehen. Unterstützt die Kategorisierung nach Modell und Zeitraum und hilft so bei der Nutzungsoptimierung und Kostenkontrolle.

Was soll ich tun, wenn ein Aufruf fehlschlägt oder einen Fehler zurückgibt?

API-Fehler enthalten einen Fehlercode und eine Erklärung. Häufige Ursachen:
  • Fehlerhaftes Anfrageformat.
  • Modell nicht verfügbar oder Nutzungslimit überschritten.
Schauen Sie in den API-Leitfaden zur Fehlerbehebung oder kontaktieren Sie den Support unter feedback@aihubmix.com.

Wie verwalte ich meinen API-Schlüssel?

Benutzer können API-Schlüssel über das Dashboard generieren, widerrufen oder aktualisieren.
  • Geben Sie API-Schlüssel nicht in öffentlichen Umgebungen preis.
  • Verwenden Sie separate Schlüssel für verschiedene Projekte.
  • Rotieren Sie die Schlüssel regelmäßig, um die Kontosicherheit zu gewährleisten.

Zuletzt aktualisiert: 2026-06-01