
Auto Router
Defina o nome do modelo comoauto, e o gateway seleciona o melhor modelo entre as centenas disponíveis na plataforma com base na sua solicitação — com estratégias de menor custo, maior qualidade ou menor latência, faturado pelo modelo que ele realmente utiliza. Sem comparação manual ou troca de modelos, e sem alterações no código do cliente. Veja Auto Router.
Qualquer modelo no protocolo Responses
O endpoint/v1/responses não está mais limitado à família GPT — agora pode chamar qualquer modelo da plataforma. Ferramentas construídas sobre o protocolo Responses (como o Codex CLI) podem, portanto, usar GLM, Gemini, DeepSeek, Kimi, Qwen e mais por meio de um catálogo de modelos local, em vez de ficarem restritas aos modelos oficiais da OpenAI. Veja Codex CLI · Modelos personalizados.
Model Mapping & Fallback
Configure o mapeamento de aliases e o fallback em caso de falha por chave de API no console: seu cliente pode usar qualquer nome de modelo, que o gateway reescreve para o modelo real do upstream; se o principal falhar, ele alterna automaticamente para um backup, faturado pelo modelo que finalmente responder. Um único contratempo não derrubará seu tráfego de produção, e o código do cliente permanece intocado. Veja Model Mapping & Fallback.AIHubMix CLI
Um único binário com zero dependências — sem necessidade de Python, Node ou Go. Consulte seu saldo, gerencie chaves de API e liste os modelos disponíveis diretamente do terminal, com suporte de primeira classe para scripts e agentes de IA como o Claude Code. Veja AIHubMix CLI.AIHubMix Skill (extensão para agentes de codificação de IA)
Uma extensão local para agentes de IA que oferecem suporte a Skills — Codex, Claude Code, Cursor, Cline e mais. Use linguagem natural para integrar a AIHubMix, consultar modelos, selecionar por capacidade, gerar exemplos e solucionar erros. Em vez de embutir uma lista fixa de modelos, a Skill lê informações ao vivo de modelos, preços e protocolos das APIs oficiais da AIHubMix sob demanda, para que o agente nunca dependa de memória desatualizada. Veja Skills.Domínio de backup: api.inferera.com
Quando o domínio principalaihubmix.com estiver inacessível ou atingir o tempo limite, aponte suas solicitações para https://api.inferera.com. Os endpoints e capacidades são idênticos — sua chave de API, modelo e corpo da solicitação não mudam.
Também lançado
- Entrada de áudio do Gemini: o endpoint compatível com OpenAI (
/v1/chat/completions) agora aceitainput_audioe retorna audio_tokens no usage. - GLM 5.2 reasoning effort: o canal nativo da Zhipu oferece suporte a
reasoning_effortpara profundidade de raciocínio ajustável. - Integração com Open Design: a AIHubMix agora é um gateway BYOK integrado ao Open Design.
- Correção do plugin OpenClaw: o aihubmix-auth foi corrigido e está estável para uso.
Estabilidade & correções
- Melhoria na precisão do faturamento e na exatidão da medição de cache.
- Corrigidos modelos ausentes em
/v1/models. - Corrigidos vários problemas de geração de vídeo e de teste de canais.
Novos modelos deste mês (~20)
Chat / Geral- claude-fable-5 [Descontinuado]: a geração mais recente da Claude, com proteções de segurança mais fortes (veja Changelog · notas do Fable 5).
- minimax-m3, qwen3.7-plus, glm-5.2, e os Doubao doubao-seed-2-1-pro / doubao-seed-2-1-turbo.
- kimi-k2.7-code e kimi-k2.7-code-highspeed: a série de código da Kimi, incluindo uma variante de alta velocidade.
- coding-glm-5.2 e o gratuito coding-glm-5.2-free.
- Kling: texto-para-vídeo, imagem-para-vídeo, referência de múltiplas imagens e geração multimodal omni.
- happyhorse-1.1: texto-para-vídeo (t2v), referência (r2v) e imagem-para-vídeo (i2v).
- O musesteamer-air-image da Baidu para geração de imagens.
- grok-build-0.1, hy3-preview, e o gratuito step-3.7-flash-free.
Preços & avisos
- step-3.7-flash, 90% de desconto (por tempo limitado): 0.132 / M tokens de saída.
- Descontinuação & roteamento automático:
claude-opus-4-20250514eclaude-sonnet-4-20250514foram aposentados no upstream em 15 de junho; a plataforma os roteia automaticamente para as versões 4-5 da mesma família.
FAQ
Quais modelos foram adicionados este mês? Cerca de 20, abrangendo chat (claude-fable-5 [Descontinuado], minimax-m3, qwen3.7-plus, glm-5.2, série doubao-seed-2-1), código (série kimi-k2.7-code, coding-glm-5.2), vídeo (Kling, happyhorse-1.1) e imagem (musesteamer-air-image). Como uso o Auto Router? Defina o nome do modelo na sua solicitação comoauto; o gateway seleciona o melhor modelo com base na sua solicitação e fatura pelo modelo que ele realmente utiliza, sem alterações no código do cliente. Veja Auto Router.
E se o domínio principal estiver inacessível?
Substitua o endereço da solicitação pelo domínio de backup https://api.inferera.com. Os endpoints e capacidades são idênticos, e nenhum parâmetro precisa ser alterado.
Qual é o preço por tempo limitado do step-3.7-flash?
0.132 / M tokens de saída.
Explore todos os modelos no catálogo de modelos, e encontre detalhes de integração na documentação.
Atualizado: 2026-06-30