Use this file to discover all available pages before exploring further.
Compatible con la interfaz multifunción Responses API de OpenAI; se han lanzado las siguientes funciones:
Entrada de texto: Entrada de texto
Entrada de imagen: Entrada de imagen
Streaming: Streaming
Búsqueda web: Búsqueda web
Investigación profunda: Para tareas complejas de análisis e investigación
Razonamiento: Control de la profundidad del razonamiento; admite 4 niveles (minimal / low / medium / high). Solo la serie gpt-5 admite minimal.
Verbosity: Longitud de la salida; la serie gpt-5 admite 3 niveles (low / medium / high)
Functions: Funciones
Uso de la herramienta image_generation: El dibujo y la generación de imágenes se facturan en gpt-image-1.
Code Interpreter: Permite a los modelos escribir y ejecutar Python para resolver problemas. reasoning.effort ‘minimal’ no se admite al usar code interpreter con gpt-5.
Igual que el método oficial de llamada de OpenAI; solo tienes que reemplazar api_key y base_url para el reenvío.
China continental puede acceder directamente.
client = OpenAI( api_key="AIHUBMIX_API_KEY", # Replace with the key you generated in AiHubMix base_url="https://aihubmix.com/v1")
Para los modelos de inferencia, el resumen de razonamiento de salida puede controlarse con el siguiente parámetro; la riqueza del detalle del resumen sigue el orden detailed > auto > None, donde auto ofrece el mejor equilibrio.
"summary": "auto"
Modelos opcionales de razonamiento profundo: o3-deep-research y o4-mini-deep-research, solo admitidos en el endpoint responses.
La serie gpt-5 se centra en un razonamiento estable y salidas consistentes, y ya no admite los parámetros temperature y top_p para controlar la aleatoriedad. Si necesitas más libertad, puedes probar gpt-5-chat-latest, que admite temperature.
Los modelos de razonamiento (serie o / serie gpt-5) han descontinuado max_tokens. Usa max_completion_tokens para completions o max_output_tokens para responses para establecer explícitamente el límite de tokens de salida.
from openai import OpenAIclient = OpenAI( api_key="sk-***", # Replace with the key generated in your AIHubMix dashboard base_url="https://aihubmix.com/v1")response = client.responses.create( model="gpt-5", # gpt-5, gpt-5-chat-latest, gpt-5-mini, gpt-5-nano input="Why is tarot divination effective? What are the underlying principles and transferable methods? Output format: Markdown", # GPT-5 does not output in Markdown format by default, so you need to explicitly specify it. reasoning={ "effort": "minimal" # Reasoning depth – Controls how many reasoning tokens the model generates before producing a response. Value can be "minimal", "low", "medium" or "high". Default is "medium". }, text={ "verbosity": "low" # Output length – Verbosity determines how many output tokens are generated. Value can be "low", "medium", or "high". Models before GPT-5 defaulted to "medium" verbosity. }, stream=True)for event in response: print(event)
Nota:
El más reciente codex-mini-latestno admite búsqueda.
La función Computer use requiere integración con Playwright. Se recomienda consultar el repositorio oficial.
Problemas conocidos:
Los casos de uso son complejos de invocar
Realiza muchas capturas de pantalla, lo que consume tiempo y suele ser poco fiable
Puede activar CAPTCHA o la verificación humana de Cloudflare, lo que puede llevar a bucles infinitos