Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

Unterstützung der multifunktionalen OpenAI-Responses-API. Folgende Funktionen sind verfügbar:
  • Text input: Texteingabe
  • Image input: Bildeingabe
  • Streaming: Streaming
  • Web search: Websuche
  • Deep research: Für komplexe Analyse- und Recherche-Aufgaben
  • Reasoning: Reasoning-Tiefensteuerung, unterstützt 4 Stufen (minimal / low / medium / high). Nur die gpt-5-Serie unterstützt minimal.
  • Verbosity: Ausgabelänge, die gpt-5-Serie unterstützt 3 Stufen (low / medium / high)
  • Functions: Functions
  • Verwendung des image_generation-Tools: Bilderzeugung wird unter gpt-image-1 abgerechnet.
  • Code Interpreter: Erlaubt Modellen, Python zu schreiben und auszuführen, um Probleme zu lösen. reasoning.effort „minimal” wird zusammen mit dem Code Interpreter bei gpt-5 nicht unterstützt.
  • Remote MCP: Aufruf eines Remote-MCP-Servers
  • Computer Use: Computer Use

Verwendung (Python-Aufruf):

Identisch mit der offiziellen OpenAI-Aufrufmethode; ersetzen Sie lediglich api_key und base_url zum Forwarden. Festland China kann direkt zugreifen.
client = OpenAI(
    api_key="AIHUBMIX_API_KEY", # Replace with the key you generated in AiHubMix
    base_url="https://aihubmix.com/v1"
)
  1. Bei Reasoning-Modellen kann die Ausgabe-Reasoning-Zusammenfassung mit folgendem Parameter gesteuert werden; die Detailtiefe der Zusammenfassung folgt der Reihenfolge detailed > auto > None, wobei auto den besten Ausgleich bietet.
"summary": "auto"
  1. Optionale Deep-Reasoning-Modelle: ‎⁠o3-deep-research⁠ und ‎⁠o4-mini-deep-research⁠, nur am ‎⁠responses⁠-Endpoint unterstützt.
  2. Die gpt-5-Serie konzentriert sich auf stabiles Reasoning und konsistente Ausgaben und unterstützt die Parameter temperature und top_p zur Steuerung der Zufälligkeit nicht mehr. Wenn Sie mehr Spielraum benötigen, können Sie gpt-5-chat-latest ausprobieren, das temperature unterstützt.
  3. Reasoning-Modelle (o-Serie / gpt-5-Serie) haben max_tokens veraltet. Bitte verwenden Sie max_completion_tokens für Completions oder max_output_tokens für Responses, um das Output-Token-Limit explizit zu setzen.
from openai import OpenAI

client = OpenAI(
    api_key="sk-***", # Replace with the key generated in your AIHubMix dashboard
    base_url="https://aihubmix.com/v1"
)

response = client.responses.create(
    model="gpt-5", # gpt-5, gpt-5-chat-latest, gpt-5-mini, gpt-5-nano
    input="Why is tarot divination effective? What are the underlying principles and transferable methods? Output format: Markdown", # GPT-5 does not output in Markdown format by default, so you need to explicitly specify it.
    reasoning={
        "effort": "minimal" # Reasoning depth – Controls how many reasoning tokens the model generates before producing a response. Value can be "minimal", "low", "medium" or "high". Default is "medium".
    },
    text={
        "verbosity": "low" # Output length – Verbosity determines how many output tokens are generated. Value can be "low", "medium", or "high". Models before GPT-5 defaulted to "medium" verbosity.
    },
    stream=True
)

for event in response:
  print(event)
Hinweis:
  1. Das neueste codex-mini-latest unterstützt keine Suche.
  2. Das Feature Computer use erfordert die Integration mit Playwright. Es wird empfohlen, das offizielle Repository zu konsultieren.
Bekannte Probleme:
  • Anwendungsfälle sind komplex aufzurufen
  • Viele Screenshots werden benötigt, was zeitaufwändig und oft unzuverlässig ist
  • Kann CAPTCHA oder Cloudflare-Verifizierungen auslösen und so zu Endlosschleifen führen

Zuletzt aktualisiert: 2026-06-01