> ## Documentation Index
> Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
> Use this file to discover all available pages before exploring further.

# Release Spotlight de Junho de 2026: ~20 Novos Modelos

> Em junho de 2026, a AIHubMix adicionou ~20 novos modelos — claude-fable-5 [Descontinuado], glm-5.2, minimax-m3, qwen3.7-plus, kimi-k2.7-code, vídeo Kling e mais — e lançou o Auto Router, o protocolo Responses para qualquer modelo, Mapping & Fallback, a AIHubMix CLI e a Skill, além de um domínio de backup.

<Frame>
  <img src="https://mintcdn.com/aihubmix/KfVPdfHEI_4FVLQw/images/blogs/aihubmix-2026-06-recap.webp?fit=max&auto=format&n=KfVPdfHEI_4FVLQw&q=85&s=7af8996a5bc985f3996cf796e3299a4f" alt="AIHubMix Release Spotlight de Junho de 2026: novos modelos e capacidades da plataforma" width="2400" height="1260" data-path="images/blogs/aihubmix-2026-06-recap.webp" />
</Frame>

Este mês a AIHubMix adicionou cerca de 20 novos modelos abrangendo chat, código, vídeo e imagem, e lançou várias capacidades de plataforma. A mesma chave de API agora alcança ainda mais. Aqui estão os destaques.

## Auto Router

Defina o nome do modelo como `auto`, e o gateway seleciona o melhor modelo entre as centenas disponíveis na plataforma com base na sua solicitação — com estratégias de menor custo, maior qualidade ou menor latência, faturado pelo modelo que ele realmente utiliza. Sem comparação manual ou troca de modelos, e sem alterações no código do cliente. Veja [Auto Router](/pt/api/auto-router).

## Qualquer modelo no protocolo Responses

O endpoint `/v1/responses` não está mais limitado à família GPT — agora pode chamar qualquer modelo da plataforma. Ferramentas construídas sobre o protocolo Responses (como o Codex CLI) podem, portanto, usar GLM, Gemini, DeepSeek, Kimi, Qwen e mais por meio de um catálogo de modelos local, em vez de ficarem restritas aos modelos oficiais da OpenAI. Veja [Codex CLI · Modelos personalizados](/pt/api/Codex-CLI#custom-models).

## Model Mapping & Fallback

Configure o mapeamento de aliases e o fallback em caso de falha por chave de API no console: seu cliente pode usar qualquer nome de modelo, que o gateway reescreve para o modelo real do upstream; se o principal falhar, ele alterna automaticamente para um backup, faturado pelo modelo que finalmente responder. Um único contratempo não derrubará seu tráfego de produção, e o código do cliente permanece intocado. Veja [Model Mapping & Fallback](/pt/api/Model-Mapping-Fallback).

## AIHubMix CLI

Um único binário com zero dependências — sem necessidade de Python, Node ou Go. Consulte seu saldo, gerencie chaves de API e liste os modelos disponíveis diretamente do terminal, com suporte de primeira classe para scripts e agentes de IA como o Claude Code. Veja [AIHubMix CLI](/pt/api/aihubmix-cli).

## AIHubMix Skill (extensão para agentes de codificação de IA)

Uma extensão local para agentes de IA que oferecem suporte a Skills — Codex, Claude Code, Cursor, Cline e mais. Use linguagem natural para integrar a AIHubMix, consultar modelos, selecionar por capacidade, gerar exemplos e solucionar erros. Em vez de embutir uma lista fixa de modelos, a Skill lê informações ao vivo de modelos, preços e protocolos das APIs oficiais da AIHubMix sob demanda, para que o agente nunca dependa de memória desatualizada. Veja [Skills](/pt/skills).

## Domínio de backup: api.inferera.com

Quando o domínio principal `aihubmix.com` estiver inacessível ou atingir o tempo limite, aponte suas solicitações para `https://api.inferera.com`. Os endpoints e capacidades são idênticos — sua chave de API, modelo e corpo da solicitação não mudam.

## Também lançado

* **Entrada de áudio do Gemini**: o endpoint compatível com OpenAI (`/v1/chat/completions`) agora aceita `input_audio` e retorna audio\_tokens no usage.
* **GLM 5.2 reasoning effort**: o canal nativo da Zhipu oferece suporte a `reasoning_effort` para profundidade de raciocínio ajustável.
* **Integração com Open Design**: a AIHubMix agora é um gateway BYOK integrado ao [Open Design](/pt/clients/Open-Design).
* **Correção do plugin OpenClaw**: o [aihubmix-auth](https://github.com/akakenle/aihubmix-auth) foi corrigido e está estável para uso.

## Estabilidade & correções

* Melhoria na precisão do faturamento e na exatidão da medição de cache.
* Corrigidos modelos ausentes em `/v1/models`.
* Corrigidos vários problemas de geração de vídeo e de teste de canais.

## Novos modelos deste mês (\~20)

**Chat / Geral**

* **claude-fable-5** \[Descontinuado]: a geração mais recente da Claude, com proteções de segurança mais fortes (veja [Changelog · notas do Fable 5](/pt/update/News#10-de-junho)).
* **minimax-m3**, **qwen3.7-plus**, **glm-5.2**, e os Doubao **doubao-seed-2-1-pro / doubao-seed-2-1-turbo**.

**Código**

* **kimi-k2.7-code** e **kimi-k2.7-code-highspeed**: a série de código da Kimi, incluindo uma variante de alta velocidade.
* **coding-glm-5.2** e o gratuito **coding-glm-5.2-free**.

**Vídeo**

* **Kling**: texto-para-vídeo, imagem-para-vídeo, referência de múltiplas imagens e geração multimodal omni.
* **happyhorse-1.1**: texto-para-vídeo (t2v), referência (r2v) e imagem-para-vídeo (i2v).

**Imagem**

* O **musesteamer-air-image** da Baidu para geração de imagens.

**Também novos**

* **grok-build-0.1**, **hy3-preview**, e o gratuito **step-3.7-flash-free**.

## Preços & avisos

* **step-3.7-flash, 90% de desconto (por tempo limitado)**: $0.022 / M tokens de entrada, $0.132 / M tokens de saída.
* **Descontinuação & roteamento automático**: `claude-opus-4-20250514` e `claude-sonnet-4-20250514` foram aposentados no upstream em 15 de junho; a plataforma os roteia automaticamente para as versões 4-5 da mesma família.

## FAQ

**Quais modelos foram adicionados este mês?**
Cerca de 20, abrangendo chat (claude-fable-5 \[Descontinuado], minimax-m3, qwen3.7-plus, glm-5.2, série doubao-seed-2-1), código (série kimi-k2.7-code, coding-glm-5.2), vídeo (Kling, happyhorse-1.1) e imagem (musesteamer-air-image).

**Como uso o Auto Router?**
Defina o nome do modelo na sua solicitação como `auto`; o gateway seleciona o melhor modelo com base na sua solicitação e fatura pelo modelo que ele realmente utiliza, sem alterações no código do cliente. Veja [Auto Router](/pt/api/auto-router).

**E se o domínio principal estiver inacessível?**
Substitua o endereço da solicitação pelo domínio de backup `https://api.inferera.com`. Os endpoints e capacidades são idênticos, e nenhum parâmetro precisa ser alterado.

**Qual é o preço por tempo limitado do step-3.7-flash?**
$0.022 / M tokens de entrada e $0.132 / M tokens de saída.

Explore todos os modelos no [catálogo de modelos](https://aihubmix.com), e encontre detalhes de integração na [documentação](https://docs.aihubmix.com).

***

Atualizado: 2026-06-30