AiHubMix Documentation Hub

本月 AIHubMix 新增近 20 款模型，涵蓋對話、程式碼、影片與圖像，並上線多項平台能力。同一把 API Key 可呼叫的能力進一步擴展。以下是本月重點更新。

模型智慧路由（Auto Router）

將模型名設為 auto，閘道即按請求內容從平台數百個模型中自動選擇最佳模型，支援成本優先、品質優先、低延遲等策略，並按實際命中的模型計費。無需手動比較與切換模型，用戶端程式碼無需改動。詳見模型智慧路由。

Responses 協議支援任意模型

/v1/responses 端點不再限於 GPT 系列，現可呼叫平台上的任意模型。基於 Responses 協議的工具（如 Codex CLI）因此能透過本機模型目錄使用 GLM、Gemini、DeepSeek、Kimi、Qwen 等模型，不再侷限於 OpenAI 官方模型。詳見 Codex CLI · 自訂模型。

模型映射與錯誤回退（Mapping & Fallback）

在主控台為每個 API Key 設定模型別名映射與失敗回退：用戶端可自訂模型名，由閘道改寫為真實上游模型；主模型失敗時自動切換至備用模型，並按最終回應的模型計費。可避免單點故障導致線上請求中斷，且用戶端程式碼無需改動。詳見模型映射與回退。

AIHubMix CLI 命令列工具

單一二進位檔、零相依，無需安裝 Python / Node / Go 即可執行。可在終端機直接查詢餘額、管理 API Key、檢視可用模型，並對指令稿與 AI Agent（如 Claude Code）友善。詳見 AIHubMix CLI。

AIHubMix Skill（AI 程式設計助手擴充）

為 Codex、Claude Code、Cursor、Cline 等支援 Skills 的 AI Agent 提供本機擴充能力：用自然語言完成 AIHubMix 接入、模型查詢、按能力選型、範例生成與錯誤排查。該 Skill 不內建固定模型清單，而是按需從 AIHubMix 官方介面讀取模型、價格、協議契約等即時資訊，避免 Agent 依賴過期記憶。詳見 Skills。

備用網域 api.inferera.com

當主網域 aihubmix.com 無法存取或逾時時，可將請求位址替換為 https://api.inferera.com。端點與能力完全一致，API Key、模型、請求體均無需改動。

其他功能更新

Gemini 音訊輸入：OpenAI 相容介面（/v1/chat/completions）現已支援 input_audio，並在 usage 中回傳 audio_tokens。
智譜 GLM 5.2 推理強度分檔：原生智譜通道支援 reasoning_effort，可自訂思考深度。
Open Design 接入：AIHubMix 現已成為 Open Design 的內建 BYOK 閘道。
OpenClaw 接入外掛修復：aihubmix-auth 已修復，現可穩定使用。

穩定性與修復

最佳化計費精度與快取計量準確性。
修復 /v1/models 部分模型缺失。
修復若干影片生成與通道測試問題。

本月新模型（近 20 款）

對話 / 通用

claude-fable-5【已退役】：Claude 最新一代，安全護欄更強（詳見更新日誌 · Fable 5 特性說明）。
minimax-m3、qwen3.7-plus、glm-5.2、豆包 doubao-seed-2-1-pro / doubao-seed-2-1-turbo。

程式碼

kimi-k2.7-code、kimi-k2.7-code-highspeed：Kimi 程式碼系列，含高速版。
coding-glm-5.2 及免費版 coding-glm-5.2-free。

影片

可靈 Kling：文生、圖生、多圖參考、omni 多模態影片生成。
happyhorse-1.1：文生（t2v）、參考生成（r2v）、圖生（i2v）三檔。

圖像

百度 musesteamer-air-image 圖像生成。

其他新增

grok-build-0.1、hy3-preview、免費模型 step-3.7-flash-free。

價格與公告

step-3.7-flash 限時 1 折：輸入 0.022 美元 / 百萬 token，輸出 0.132 美元 / 百萬 token。
模型下架與自動路由：claude-opus-4-20250514、claude-sonnet-4-20250514 官方 6 月 15 日下架，平台會自動把它們路由到同系列 4-5 版本。

常見問題

本月新增了哪些模型？ 近 20 款，涵蓋對話（claude-fable-5【已退役】、minimax-m3、qwen3.7-plus、glm-5.2、doubao-seed-2-1 系列）、程式碼（kimi-k2.7-code 系列、coding-glm-5.2）、影片（可靈 Kling、happyhorse-1.1）與圖像（musesteamer-air-image）。 模型智慧路由如何使用？ 將請求中的模型名設為 auto，閘道會按請求內容自動選擇最佳模型，並按實際命中的模型計費，無需改動用戶端程式碼。詳見模型智慧路由。 主網域無法存取時怎麼辦？ 可將請求位址替換為備用網域 https://api.inferera.com，端點與能力完全一致，API Key、模型、請求體均無需改動。 step-3.7-flash 的限時優惠價是多少？ 輸入 0.022 美元 / 百萬 token，輸出 0.132 美元 / 百萬 token。檢視全部模型請造訪模型廣場，接入細節詳見文件中心。

更新時間：2026-06-30

​模型智慧路由（Auto Router）

​Responses 協議支援任意模型

​模型映射與錯誤回退（Mapping & Fallback）

​AIHubMix CLI 命令列工具

​AIHubMix Skill（AI 程式設計助手擴充）

​備用網域 api.inferera.com

​其他功能更新

​穩定性與修復

​本月新模型（近 20 款）

​價格與公告

​常見問題