
Auto Router
Establece el nombre del modelo enauto y la puerta de enlace selecciona el mejor modelo entre los cientos disponibles en la plataforma según tu solicitud — con estrategias que priorizan el coste, la calidad o la baja latencia, facturando según el modelo que realmente utiliza. Sin comparaciones manuales ni cambios de modelo, y sin modificar el código del cliente. Consulta Auto Router.
Cualquier modelo en el protocolo Responses
El endpoint/v1/responses ya no está limitado a la familia GPT — ahora puede invocar cualquier modelo de la plataforma. Por lo tanto, las herramientas construidas sobre el protocolo Responses (como Codex CLI) pueden usar GLM, Gemini, DeepSeek, Kimi, Qwen y más mediante un catálogo de modelos local, en lugar de quedar restringidas a los modelos oficiales de OpenAI. Consulta Codex CLI · Modelos personalizados.
Model Mapping y Fallback
Configura el mapeo de alias y el fallback ante fallos por cada clave de API en la consola: tu cliente puede usar cualquier nombre de modelo, que la puerta de enlace reescribe al modelo upstream real; si el primario falla, cambia automáticamente a uno de respaldo, facturando según el modelo que finalmente responde. Un único tropiezo no interrumpirá tu tráfico de producción, y el código del cliente permanece intacto. Consulta Model Mapping y Fallback.AIHubMix CLI
Un único binario sin dependencias — no requiere Python, Node ni Go. Consulta tu saldo, gestiona claves de API y lista los modelos disponibles directamente desde la terminal, con soporte de primera clase para scripts y agentes de IA como Claude Code. Consulta AIHubMix CLI.AIHubMix Skill (extensión para agentes de programación con IA)
Una extensión local para agentes de IA que admiten Skills — Codex, Claude Code, Cursor, Cline y más. Usa lenguaje natural para integrar AIHubMix, consultar modelos, seleccionar por capacidad, generar ejemplos y solucionar errores. En lugar de incluir una lista fija de modelos, la Skill lee bajo demanda la información de modelos, precios y protocolos desde las APIs oficiales de AIHubMix, de modo que el agente nunca depende de una memoria desactualizada. Consulta Skills.Dominio de respaldo: api.inferera.com
Cuando el dominio principalaihubmix.com no esté accesible o agote el tiempo de espera, dirige tus solicitudes a https://api.inferera.com. Los endpoints y las capacidades son idénticos — tu clave de API, el modelo y el cuerpo de la solicitud no cambian.
También lanzado
- Entrada de audio en Gemini: el endpoint compatible con OpenAI (
/v1/chat/completions) ahora aceptainput_audioy devuelve audio_tokens en el uso. - Reasoning effort en GLM 5.2: el canal nativo de Zhipu admite
reasoning_effortpara una profundidad de razonamiento ajustable. - Integración con Open Design: AIHubMix es ahora una puerta de enlace BYOK integrada para Open Design.
- Corrección del plugin de OpenClaw: aihubmix-auth está corregido y es estable para su uso.
Estabilidad y correcciones
- Mejora de la precisión de facturación y de la exactitud de la medición de caché.
- Corregidos los modelos que faltaban en
/v1/models. - Corregidos varios problemas de generación de vídeo y de prueba de canales.
Nuevos modelos este mes (~20)
Chat / General- claude-fable-5 [Retirado]: la última generación de Claude, con barreras de seguridad más sólidas (consulta Changelog · Notas de Fable 5).
- minimax-m3, qwen3.7-plus, glm-5.2, y los de Doubao doubao-seed-2-1-pro / doubao-seed-2-1-turbo.
- kimi-k2.7-code y kimi-k2.7-code-highspeed: la serie de código de Kimi, que incluye una variante de alta velocidad.
- coding-glm-5.2 y el gratuito coding-glm-5.2-free.
- Kling: texto a vídeo, imagen a vídeo, referencia con múltiples imágenes y generación multimodal omni.
- happyhorse-1.1: texto a vídeo (t2v), referencia (r2v) e imagen a vídeo (i2v).
- musesteamer-air-image de Baidu para la generación de imágenes.
- grok-build-0.1, hy3-preview, y el gratuito step-3.7-flash-free.
Precios y avisos
- step-3.7-flash, 90% de descuento (por tiempo limitado): 0.132 / M tokens de salida.
- Retirada y enrutamiento automático:
claude-opus-4-20250514yclaude-sonnet-4-20250514fueron retirados upstream el 15 de junio; la plataforma los enruta automáticamente a las versiones 4-5 de la misma familia.
Preguntas frecuentes
¿Qué modelos se añadieron este mes? Alrededor de 20, abarcando chat (claude-fable-5 [Retirado], minimax-m3, qwen3.7-plus, glm-5.2, serie doubao-seed-2-1), código (serie kimi-k2.7-code, coding-glm-5.2), vídeo (Kling, happyhorse-1.1) e imagen (musesteamer-air-image). ¿Cómo uso el Auto Router? Establece el nombre del modelo en tu solicitud enauto; la puerta de enlace selecciona el mejor modelo según tu solicitud y factura según el modelo que realmente utiliza, sin cambios en el código del cliente. Consulta Auto Router.
¿Qué pasa si el dominio principal no está accesible?
Reemplaza la dirección de la solicitud por el dominio de respaldo https://api.inferera.com. Los endpoints y las capacidades son idénticos, y no es necesario cambiar ningún parámetro.
¿Cuál es el precio por tiempo limitado de step-3.7-flash?
0.132 / M tokens de salida.
Explora todos los modelos en el catálogo de modelos y encuentra los detalles de integración en la documentación.
Actualizado: 2026-06-30