AiHubMix Documentation Hub

AIHubMix Release Spotlight de Junho de 2026: novos modelos e capacidades da plataforma

Este mês a AIHubMix adicionou cerca de 20 novos modelos abrangendo chat, código, vídeo e imagem, e lançou várias capacidades de plataforma. A mesma chave de API agora alcança ainda mais. Aqui estão os destaques.

Auto Router

Defina o nome do modelo como auto, e o gateway seleciona o melhor modelo entre as centenas disponíveis na plataforma com base na sua solicitação — com estratégias de menor custo, maior qualidade ou menor latência, faturado pelo modelo que ele realmente utiliza. Sem comparação manual ou troca de modelos, e sem alterações no código do cliente. Veja Auto Router.

Qualquer modelo no protocolo Responses

O endpoint /v1/responses não está mais limitado à família GPT — agora pode chamar qualquer modelo da plataforma. Ferramentas construídas sobre o protocolo Responses (como o Codex CLI) podem, portanto, usar GLM, Gemini, DeepSeek, Kimi, Qwen e mais por meio de um catálogo de modelos local, em vez de ficarem restritas aos modelos oficiais da OpenAI. Veja Codex CLI · Modelos personalizados.

Model Mapping & Fallback

Configure o mapeamento de aliases e o fallback em caso de falha por chave de API no console: seu cliente pode usar qualquer nome de modelo, que o gateway reescreve para o modelo real do upstream; se o principal falhar, ele alterna automaticamente para um backup, faturado pelo modelo que finalmente responder. Um único contratempo não derrubará seu tráfego de produção, e o código do cliente permanece intocado. Veja Model Mapping & Fallback.

AIHubMix CLI

Um único binário com zero dependências — sem necessidade de Python, Node ou Go. Consulte seu saldo, gerencie chaves de API e liste os modelos disponíveis diretamente do terminal, com suporte de primeira classe para scripts e agentes de IA como o Claude Code. Veja AIHubMix CLI.

AIHubMix Skill (extensão para agentes de codificação de IA)

Uma extensão local para agentes de IA que oferecem suporte a Skills — Codex, Claude Code, Cursor, Cline e mais. Use linguagem natural para integrar a AIHubMix, consultar modelos, selecionar por capacidade, gerar exemplos e solucionar erros. Em vez de embutir uma lista fixa de modelos, a Skill lê informações ao vivo de modelos, preços e protocolos das APIs oficiais da AIHubMix sob demanda, para que o agente nunca dependa de memória desatualizada. Veja Skills.

Domínio de backup: api.inferera.com

Quando o domínio principal aihubmix.com estiver inacessível ou atingir o tempo limite, aponte suas solicitações para https://api.inferera.com. Os endpoints e capacidades são idênticos — sua chave de API, modelo e corpo da solicitação não mudam.

Também lançado

Entrada de áudio do Gemini: o endpoint compatível com OpenAI (/v1/chat/completions) agora aceita input_audio e retorna audio_tokens no usage.
GLM 5.2 reasoning effort: o canal nativo da Zhipu oferece suporte a reasoning_effort para profundidade de raciocínio ajustável.
Integração com Open Design: a AIHubMix agora é um gateway BYOK integrado ao Open Design.
Correção do plugin OpenClaw: o aihubmix-auth foi corrigido e está estável para uso.

Estabilidade & correções

Melhoria na precisão do faturamento e na exatidão da medição de cache.
Corrigidos modelos ausentes em /v1/models.
Corrigidos vários problemas de geração de vídeo e de teste de canais.

Novos modelos deste mês (~20)

Chat / Geral

claude-fable-5 [Descontinuado]: a geração mais recente da Claude, com proteções de segurança mais fortes (veja Changelog · notas do Fable 5).
minimax-m3, qwen3.7-plus, glm-5.2, e os Doubao doubao-seed-2-1-pro / doubao-seed-2-1-turbo.

Código

kimi-k2.7-code e kimi-k2.7-code-highspeed: a série de código da Kimi, incluindo uma variante de alta velocidade.
coding-glm-5.2 e o gratuito coding-glm-5.2-free.

Vídeo

Kling: texto-para-vídeo, imagem-para-vídeo, referência de múltiplas imagens e geração multimodal omni.
happyhorse-1.1: texto-para-vídeo (t2v), referência (r2v) e imagem-para-vídeo (i2v).

Imagem

O musesteamer-air-image da Baidu para geração de imagens.

Também novos

grok-build-0.1, hy3-preview, e o gratuito step-3.7-flash-free.

Preços & avisos

step-3.7-flash, 90% de desconto (por tempo limitado): $0.022 / M tokens de entrada,$ 0.132 / M tokens de saída.
Descontinuação & roteamento automático: claude-opus-4-20250514 e claude-sonnet-4-20250514 foram aposentados no upstream em 15 de junho; a plataforma os roteia automaticamente para as versões 4-5 da mesma família.

FAQ

Quais modelos foram adicionados este mês? Cerca de 20, abrangendo chat (claude-fable-5 [Descontinuado], minimax-m3, qwen3.7-plus, glm-5.2, série doubao-seed-2-1), código (série kimi-k2.7-code, coding-glm-5.2), vídeo (Kling, happyhorse-1.1) e imagem (musesteamer-air-image). Como uso o Auto Router? Defina o nome do modelo na sua solicitação como auto; o gateway seleciona o melhor modelo com base na sua solicitação e fatura pelo modelo que ele realmente utiliza, sem alterações no código do cliente. Veja Auto Router. E se o domínio principal estiver inacessível? Substitua o endereço da solicitação pelo domínio de backup https://api.inferera.com. Os endpoints e capacidades são idênticos, e nenhum parâmetro precisa ser alterado. Qual é o preço por tempo limitado do step-3.7-flash?

0.022 / M tokens de entrada e

0.132 / M tokens de saída. Explore todos os modelos no catálogo de modelos, e encontre detalhes de integração na documentação.

Atualizado: 2026-06-30

​Auto Router

​Qualquer modelo no protocolo Responses

​Model Mapping & Fallback

​AIHubMix CLI

​AIHubMix Skill (extensão para agentes de codificação de IA)

​Domínio de backup: api.inferera.com

​Também lançado

​Estabilidade & correções

​Novos modelos deste mês (~20)

​Preços & avisos

​FAQ