跳轉到主要內容
AIHubMix 2026 年 6 月更新匯總:新模型與平台能力概覽
本月 AIHubMix 新增近 20 款模型,涵蓋對話、程式碼、影片與圖像,並上線多項平台能力。同一把 API Key 可呼叫的能力進一步擴展。以下是本月重點更新。

模型智慧路由(Auto Router)

將模型名設為 auto,閘道即按請求內容從平台數百個模型中自動選擇最佳模型,支援成本優先、品質優先、低延遲等策略,並按實際命中的模型計費。無需手動比較與切換模型,用戶端程式碼無需改動。詳見 模型智慧路由

Responses 協議支援任意模型

/v1/responses 端點不再限於 GPT 系列,現可呼叫平台上的任意模型。基於 Responses 協議的工具(如 Codex CLI)因此能透過本機模型目錄使用 GLM、Gemini、DeepSeek、Kimi、Qwen 等模型,不再侷限於 OpenAI 官方模型。詳見 Codex CLI · 自訂模型

模型映射與錯誤回退(Mapping & Fallback)

在主控台為每個 API Key 設定模型別名映射與失敗回退:用戶端可自訂模型名,由閘道改寫為真實上游模型;主模型失敗時自動切換至備用模型,並按最終回應的模型計費。可避免單點故障導致線上請求中斷,且用戶端程式碼無需改動。詳見 模型映射與回退

AIHubMix CLI 命令列工具

單一二進位檔、零相依,無需安裝 Python / Node / Go 即可執行。可在終端機直接查詢餘額、管理 API Key、檢視可用模型,並對指令稿與 AI Agent(如 Claude Code)友善。詳見 AIHubMix CLI

AIHubMix Skill(AI 程式設計助手擴充)

為 Codex、Claude Code、Cursor、Cline 等支援 Skills 的 AI Agent 提供本機擴充能力:用自然語言完成 AIHubMix 接入、模型查詢、按能力選型、範例生成與錯誤排查。該 Skill 不內建固定模型清單,而是按需從 AIHubMix 官方介面讀取模型、價格、協議契約等即時資訊,避免 Agent 依賴過期記憶。詳見 Skills

備用網域 api.inferera.com

當主網域 aihubmix.com 無法存取或逾時時,可將請求位址替換為 https://api.inferera.com。端點與能力完全一致,API Key、模型、請求體均無需改動。

其他功能更新

  • Gemini 音訊輸入:OpenAI 相容介面(/v1/chat/completions)現已支援 input_audio,並在 usage 中回傳 audio_tokens。
  • 智譜 GLM 5.2 推理強度分檔:原生智譜通道支援 reasoning_effort,可自訂思考深度。
  • Open Design 接入:AIHubMix 現已成為 Open Design 的內建 BYOK 閘道。
  • OpenClaw 接入外掛修復aihubmix-auth 已修復,現可穩定使用。

穩定性與修復

  • 最佳化計費精度與快取計量準確性。
  • 修復 /v1/models 部分模型缺失。
  • 修復若干影片生成與通道測試問題。

本月新模型(近 20 款)

對話 / 通用
  • claude-fable-5【已退役】:Claude 最新一代,安全護欄更強(詳見 更新日誌 · Fable 5 特性說明)。
  • minimax-m3qwen3.7-plusglm-5.2、豆包 doubao-seed-2-1-pro / doubao-seed-2-1-turbo
程式碼
  • kimi-k2.7-codekimi-k2.7-code-highspeed:Kimi 程式碼系列,含高速版。
  • coding-glm-5.2 及免費版 coding-glm-5.2-free
影片
  • 可靈 Kling:文生、圖生、多圖參考、omni 多模態影片生成。
  • happyhorse-1.1:文生(t2v)、參考生成(r2v)、圖生(i2v)三檔。
圖像
  • 百度 musesteamer-air-image 圖像生成。
其他新增
  • grok-build-0.1hy3-preview、免費模型 step-3.7-flash-free

價格與公告

  • step-3.7-flash 限時 1 折:輸入 0.022 美元 / 百萬 token,輸出 0.132 美元 / 百萬 token。
  • 模型下架與自動路由claude-opus-4-20250514claude-sonnet-4-20250514 官方 6 月 15 日下架,平台會自動把它們路由到同系列 4-5 版本。

常見問題

本月新增了哪些模型? 近 20 款,涵蓋對話(claude-fable-5【已退役】、minimax-m3、qwen3.7-plus、glm-5.2、doubao-seed-2-1 系列)、程式碼(kimi-k2.7-code 系列、coding-glm-5.2)、影片(可靈 Kling、happyhorse-1.1)與圖像(musesteamer-air-image)。 模型智慧路由如何使用? 將請求中的模型名設為 auto,閘道會按請求內容自動選擇最佳模型,並按實際命中的模型計費,無需改動用戶端程式碼。詳見 模型智慧路由 主網域無法存取時怎麼辦? 可將請求位址替換為備用網域 https://api.inferera.com,端點與能力完全一致,API Key、模型、請求體均無需改動。 step-3.7-flash 的限時優惠價是多少? 輸入 0.022 美元 / 百萬 token,輸出 0.132 美元 / 百萬 token。 檢視全部模型請造訪 模型廣場,接入細節詳見 文件中心
更新時間:2026-06-30