AiHubMix Documentation Hub

Release Spotlight de AIHubMix de junio de 2026: nuevos modelos y capacidades de plataforma

Este mes AIHubMix añadió alrededor de 20 modelos nuevos en chat, código, vídeo e imagen, y lanzó varias capacidades de plataforma. La misma clave de API ahora alcanza aún más. Estos son los aspectos destacados.

Auto Router

Establece el nombre del modelo en auto y la puerta de enlace selecciona el mejor modelo entre los cientos disponibles en la plataforma según tu solicitud — con estrategias que priorizan el coste, la calidad o la baja latencia, facturando según el modelo que realmente utiliza. Sin comparaciones manuales ni cambios de modelo, y sin modificar el código del cliente. Consulta Auto Router.

Cualquier modelo en el protocolo Responses

El endpoint /v1/responses ya no está limitado a la familia GPT — ahora puede invocar cualquier modelo de la plataforma. Por lo tanto, las herramientas construidas sobre el protocolo Responses (como Codex CLI) pueden usar GLM, Gemini, DeepSeek, Kimi, Qwen y más mediante un catálogo de modelos local, en lugar de quedar restringidas a los modelos oficiales de OpenAI. Consulta Codex CLI · Modelos personalizados.

Model Mapping y Fallback

Configura el mapeo de alias y el fallback ante fallos por cada clave de API en la consola: tu cliente puede usar cualquier nombre de modelo, que la puerta de enlace reescribe al modelo upstream real; si el primario falla, cambia automáticamente a uno de respaldo, facturando según el modelo que finalmente responde. Un único tropiezo no interrumpirá tu tráfico de producción, y el código del cliente permanece intacto. Consulta Model Mapping y Fallback.

AIHubMix CLI

Un único binario sin dependencias — no requiere Python, Node ni Go. Consulta tu saldo, gestiona claves de API y lista los modelos disponibles directamente desde la terminal, con soporte de primera clase para scripts y agentes de IA como Claude Code. Consulta AIHubMix CLI.

AIHubMix Skill (extensión para agentes de programación con IA)

Una extensión local para agentes de IA que admiten Skills — Codex, Claude Code, Cursor, Cline y más. Usa lenguaje natural para integrar AIHubMix, consultar modelos, seleccionar por capacidad, generar ejemplos y solucionar errores. En lugar de incluir una lista fija de modelos, la Skill lee bajo demanda la información de modelos, precios y protocolos desde las APIs oficiales de AIHubMix, de modo que el agente nunca depende de una memoria desactualizada. Consulta Skills.

Dominio de respaldo: api.inferera.com

Cuando el dominio principal aihubmix.com no esté accesible o agote el tiempo de espera, dirige tus solicitudes a https://api.inferera.com. Los endpoints y las capacidades son idénticos — tu clave de API, el modelo y el cuerpo de la solicitud no cambian.

También lanzado

Entrada de audio en Gemini: el endpoint compatible con OpenAI (/v1/chat/completions) ahora acepta input_audio y devuelve audio_tokens en el uso.
Reasoning effort en GLM 5.2: el canal nativo de Zhipu admite reasoning_effort para una profundidad de razonamiento ajustable.
Integración con Open Design: AIHubMix es ahora una puerta de enlace BYOK integrada para Open Design.
Corrección del plugin de OpenClaw: aihubmix-auth está corregido y es estable para su uso.

Estabilidad y correcciones

Mejora de la precisión de facturación y de la exactitud de la medición de caché.
Corregidos los modelos que faltaban en /v1/models.
Corregidos varios problemas de generación de vídeo y de prueba de canales.

Nuevos modelos este mes (~20)

Chat / General

claude-fable-5 [Retirado]: la última generación de Claude, con barreras de seguridad más sólidas (consulta Changelog · Notas de Fable 5).
minimax-m3, qwen3.7-plus, glm-5.2, y los de Doubao doubao-seed-2-1-pro / doubao-seed-2-1-turbo.

Código

kimi-k2.7-code y kimi-k2.7-code-highspeed: la serie de código de Kimi, que incluye una variante de alta velocidad.
coding-glm-5.2 y el gratuito coding-glm-5.2-free.

Vídeo

Kling: texto a vídeo, imagen a vídeo, referencia con múltiples imágenes y generación multimodal omni.
happyhorse-1.1: texto a vídeo (t2v), referencia (r2v) e imagen a vídeo (i2v).

Imagen

musesteamer-air-image de Baidu para la generación de imágenes.

También nuevos

grok-build-0.1, hy3-preview, y el gratuito step-3.7-flash-free.

Precios y avisos

step-3.7-flash, 90% de descuento (por tiempo limitado): $0.022 / M tokens de entrada,$ 0.132 / M tokens de salida.
Retirada y enrutamiento automático: claude-opus-4-20250514 y claude-sonnet-4-20250514 fueron retirados upstream el 15 de junio; la plataforma los enruta automáticamente a las versiones 4-5 de la misma familia.

Preguntas frecuentes

¿Qué modelos se añadieron este mes? Alrededor de 20, abarcando chat (claude-fable-5 [Retirado], minimax-m3, qwen3.7-plus, glm-5.2, serie doubao-seed-2-1), código (serie kimi-k2.7-code, coding-glm-5.2), vídeo (Kling, happyhorse-1.1) e imagen (musesteamer-air-image). ¿Cómo uso el Auto Router? Establece el nombre del modelo en tu solicitud en auto; la puerta de enlace selecciona el mejor modelo según tu solicitud y factura según el modelo que realmente utiliza, sin cambios en el código del cliente. Consulta Auto Router. ¿Qué pasa si el dominio principal no está accesible? Reemplaza la dirección de la solicitud por el dominio de respaldo https://api.inferera.com. Los endpoints y las capacidades son idénticos, y no es necesario cambiar ningún parámetro. ¿Cuál es el precio por tiempo limitado de step-3.7-flash?

0.022 / M tokens de entrada y

0.132 / M tokens de salida. Explora todos los modelos en el catálogo de modelos y encuentra los detalles de integración en la documentación.

Actualizado: 2026-06-30

​Auto Router

​Cualquier modelo en el protocolo Responses

​Model Mapping y Fallback

​AIHubMix CLI

​AIHubMix Skill (extensión para agentes de programación con IA)

​Dominio de respaldo: api.inferera.com

​También lanzado

​Estabilidad y correcciones

​Nuevos modelos este mes (~20)

​Precios y avisos

​Preguntas frecuentes