> ## Documentation Index
> Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
> Use this file to discover all available pages before exploring further.

# 2026 年 6 月发布聚焦：近 20 款新模型上线

> 2026 年 6 月 AIHubMix 新接入 claude-fable-5【已退役】、glm-5.2、minimax-m3、qwen3.7-plus、kimi-k2.7-code、可灵视频等近 20 款模型，并上线模型智能路由、模型映射与回退、AIHubMix CLI 与备用域名。

<Frame>
  <img src="https://mintcdn.com/aihubmix/KfVPdfHEI_4FVLQw/images/blogs/aihubmix-2026-06-recap.webp?fit=max&auto=format&n=KfVPdfHEI_4FVLQw&q=85&s=7af8996a5bc985f3996cf796e3299a4f" alt="AIHubMix 2026 年 6 月更新汇总：新模型与平台能力概览" width="2400" height="1260" data-path="images/blogs/aihubmix-2026-06-recap.webp" />
</Frame>

本月 AIHubMix 新增近 20 款模型，覆盖对话、代码、视频与图像，并上线多项平台能力。同一把 API Key 可调用的能力进一步扩展。以下是本月重点更新。

## 模型智能路由（Auto Router）

将模型名设为 `auto`，网关即按请求内容从平台数百个模型中自动选择最优模型，支持成本优先、质量优先、低延迟等策略，并按实际命中的模型计费。无需手动比较与切换模型，客户端代码无需改动。详见 [模型智能路由](/cn/api/auto-router)。

## Responses 协议支持任意模型

`/v1/responses` 端点不再限于 GPT 系列，现可调用平台上的任意模型。基于 Responses 协议的工具（如 Codex CLI）因此能通过本地模型目录使用 GLM、Gemini、DeepSeek、Kimi、Qwen 等模型，不再局限于 OpenAI 官方模型。详见 [Codex CLI · 自定义模型](/cn/api/Codex-CLI#custom-models)。

## 模型映射与错误回退（Mapping & Fallback）

在控制台为每个 API Key 配置模型别名映射与失败回退：客户端可自定义模型名，由网关改写为真实上游模型；主模型失败时自动切换至备用模型，并按最终响应的模型计费。可避免单点故障导致线上请求中断，且客户端代码无需改动。详见 [模型映射与回退](/cn/api/Model-Mapping-Fallback)。

## AIHubMix CLI 命令行工具

单一二进制、零依赖，无需安装 Python / Node / Go 即可运行。可在终端直接查询余额、管理 API Key、查看可用模型，并对脚本与 AI Agent（如 Claude Code）友好。详见 [AIHubMix CLI](/cn/api/aihubmix-cli)。

## AIHubMix Skill（AI 编程助手扩展）

为 Codex、Claude Code、Cursor、Cline 等支持 Skills 的 AI Agent 提供本地扩展能力：用自然语言完成 AIHubMix 接入、模型查询、按能力选型、示例生成与错误排查。该 Skill 不内置固定模型清单，而是按需从 AIHubMix 官方接口读取模型、价格、协议契约等实时信息，避免 Agent 依赖过期记忆。详见 [Skills](/cn/skills)。

## 备用域名 api.inferera.com

当主域名 `aihubmix.com` 无法访问或超时时，可将请求地址替换为 `https://api.inferera.com`。端点与能力完全一致，API Key、模型、请求体均无需改动。

## 其他功能更新

* **Gemini 音频输入**：OpenAI 兼容接口（`/v1/chat/completions`）现已支持 `input_audio`，并在 usage 中返回 audio\_tokens。
* **智谱 GLM 5.2 推理强度分档**：原生智谱渠道支持 `reasoning_effort`，可自定义思考深度。
* **Open Design 接入**：AIHubMix 现已成为 [Open Design](/cn/clients/Open-Design) 的内置 BYOK 网关。
* **OpenClaw 接入插件修复**：[aihubmix-auth](https://github.com/akakenle/aihubmix-auth) 已修复，现可稳定使用。

## 稳定性与修复

* 优化计费精度与缓存计量准确性。
* 修复 `/v1/models` 部分模型缺失。
* 修复若干视频生成与渠道测试问题。

## 本月新模型（近 20 款）

**对话 / 通用**

* **claude-fable-5**【已退役】：Claude 最新一代，安全护栏更强（详见 [更新日志 · Fable 5 特性说明](/cn/update/News#06-月-10-日)）。
* **minimax-m3**、**qwen3.7-plus**、**glm-5.2**、豆包 **doubao-seed-2-1-pro / doubao-seed-2-1-turbo**。

**代码**

* **kimi-k2.7-code**、**kimi-k2.7-code-highspeed**：Kimi 代码系列，含高速版。
* **coding-glm-5.2** 及免费版 **coding-glm-5.2-free**。

**视频**

* **可灵 Kling**：文生、图生、多图参考、omni 多模态视频生成。
* **happyhorse-1.1**：文生（t2v）、参考生成（r2v）、图生（i2v）三档。

**图像**

* 百度 **musesteamer-air-image** 图像生成。

**其他新增**

* **grok-build-0.1**、**hy3-preview**、免费模型 **step-3.7-flash-free**。

## 价格与公告

* **step-3.7-flash 限时 1 折**：输入 0.022 美元 / 百万 token，输出 0.132 美元 / 百万 token。
* **模型下架与自动路由**：`claude-opus-4-20250514`、`claude-sonnet-4-20250514` 官方 6 月 15 日下架，平台会自动把它们路由到同系列 4-5 版本。

## 常见问题

**本月新增了哪些模型？**
近 20 款，涵盖对话（claude-fable-5【已退役】、minimax-m3、qwen3.7-plus、glm-5.2、doubao-seed-2-1 系列）、代码（kimi-k2.7-code 系列、coding-glm-5.2）、视频（可灵 Kling、happyhorse-1.1）与图像（musesteamer-air-image）。

**模型智能路由如何使用？**
将请求中的模型名设为 `auto`，网关会按请求内容自动选择最优模型，并按实际命中的模型计费，无需改动客户端代码。详见 [模型智能路由](/cn/api/auto-router)。

**主域名无法访问时怎么办？**
可将请求地址替换为备用域名 `https://api.inferera.com`，端点与能力完全一致，API Key、模型、请求体均无需改动。

**step-3.7-flash 的限时优惠价是多少？**
输入 0.022 美元 / 百万 token，输出 0.132 美元 / 百万 token。

查看全部模型请访问 [模型广场](https://aihubmix.com)，接入细节详见 [文档中心](https://docs.aihubmix.com)。

***

更新时间：2026-06-30