Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

Compatible con la interfaz multifunción Responses API de OpenAI; se han lanzado las siguientes funciones:
  • Entrada de texto: Entrada de texto
  • Entrada de imagen: Entrada de imagen
  • Streaming: Streaming
  • Búsqueda web: Búsqueda web
  • Investigación profunda: Para tareas complejas de análisis e investigación
  • Razonamiento: Control de la profundidad del razonamiento; admite 4 niveles (minimal / low / medium / high). Solo la serie gpt-5 admite minimal.
  • Verbosity: Longitud de la salida; la serie gpt-5 admite 3 niveles (low / medium / high)
  • Functions: Funciones
  • Uso de la herramienta image_generation: El dibujo y la generación de imágenes se facturan en gpt-image-1.
  • Code Interpreter: Permite a los modelos escribir y ejecutar Python para resolver problemas. reasoning.effort ‘minimal’ no se admite al usar code interpreter con gpt-5.
  • MCP remoto: Llamada a un servidor MCP remoto
  • Computer Use: Uso del ordenador

Uso (llamada en Python):

Igual que el método oficial de llamada de OpenAI; solo tienes que reemplazar api_key y base_url para el reenvío. China continental puede acceder directamente.
client = OpenAI(
    api_key="AIHUBMIX_API_KEY", # Replace with the key you generated in AiHubMix
    base_url="https://aihubmix.com/v1"
)
  1. Para los modelos de inferencia, el resumen de razonamiento de salida puede controlarse con el siguiente parámetro; la riqueza del detalle del resumen sigue el orden detailed > auto > None, donde auto ofrece el mejor equilibrio.
"summary": "auto"
  1. Modelos opcionales de razonamiento profundo: ⁠o3-deep-research⁠ y ⁠o4-mini-deep-research⁠, solo admitidos en el endpoint ⁠responses⁠.
  2. La serie gpt-5 se centra en un razonamiento estable y salidas consistentes, y ya no admite los parámetros temperature y top_p para controlar la aleatoriedad. Si necesitas más libertad, puedes probar gpt-5-chat-latest, que admite temperature.
  3. Los modelos de razonamiento (serie o / serie gpt-5) han descontinuado max_tokens. Usa max_completion_tokens para completions o max_output_tokens para responses para establecer explícitamente el límite de tokens de salida.
from openai import OpenAI

client = OpenAI(
    api_key="sk-***", # Replace with the key generated in your AIHubMix dashboard
    base_url="https://aihubmix.com/v1"
)

response = client.responses.create(
    model="gpt-5", # gpt-5, gpt-5-chat-latest, gpt-5-mini, gpt-5-nano
    input="Why is tarot divination effective? What are the underlying principles and transferable methods? Output format: Markdown", # GPT-5 does not output in Markdown format by default, so you need to explicitly specify it.
    reasoning={
        "effort": "minimal" # Reasoning depth – Controls how many reasoning tokens the model generates before producing a response. Value can be "minimal", "low", "medium" or "high". Default is "medium".
    },
    text={
        "verbosity": "low" # Output length – Verbosity determines how many output tokens are generated. Value can be "low", "medium", or "high". Models before GPT-5 defaulted to "medium" verbosity.
    },
    stream=True
)

for event in response:
  print(event)
Nota:
  1. El más reciente codex-mini-latest no admite búsqueda.
  2. La función Computer use requiere integración con Playwright. Se recomienda consultar el repositorio oficial.
Problemas conocidos:
  • Los casos de uso son complejos de invocar
  • Realiza muchas capturas de pantalla, lo que consume tiempo y suele ser poco fiable
  • Puede activar CAPTCHA o la verificación humana de Cloudflare, lo que puede llevar a bucles infinitos

Última actualización: 2026-06-01