
模型智能路由(Auto Router)
将模型名设为auto,网关即按请求内容从平台数百个模型中自动选择最优模型,支持成本优先、质量优先、低延迟等策略,并按实际命中的模型计费。无需手动比较与切换模型,客户端代码无需改动。详见 模型智能路由。
Responses 协议支持任意模型
/v1/responses 端点不再限于 GPT 系列,现可调用平台上的任意模型。基于 Responses 协议的工具(如 Codex CLI)因此能通过本地模型目录使用 GLM、Gemini、DeepSeek、Kimi、Qwen 等模型,不再局限于 OpenAI 官方模型。详见 Codex CLI · 自定义模型。
模型映射与错误回退(Mapping & Fallback)
在控制台为每个 API Key 配置模型别名映射与失败回退:客户端可自定义模型名,由网关改写为真实上游模型;主模型失败时自动切换至备用模型,并按最终响应的模型计费。可避免单点故障导致线上请求中断,且客户端代码无需改动。详见 模型映射与回退。AIHubMix CLI 命令行工具
单一二进制、零依赖,无需安装 Python / Node / Go 即可运行。可在终端直接查询余额、管理 API Key、查看可用模型,并对脚本与 AI Agent(如 Claude Code)友好。详见 AIHubMix CLI。AIHubMix Skill(AI 编程助手扩展)
为 Codex、Claude Code、Cursor、Cline 等支持 Skills 的 AI Agent 提供本地扩展能力:用自然语言完成 AIHubMix 接入、模型查询、按能力选型、示例生成与错误排查。该 Skill 不内置固定模型清单,而是按需从 AIHubMix 官方接口读取模型、价格、协议契约等实时信息,避免 Agent 依赖过期记忆。详见 Skills。备用域名 api.inferera.com
当主域名aihubmix.com 无法访问或超时时,可将请求地址替换为 https://api.inferera.com。端点与能力完全一致,API Key、模型、请求体均无需改动。
其他功能更新
- Gemini 音频输入:OpenAI 兼容接口(
/v1/chat/completions)现已支持input_audio,并在 usage 中返回 audio_tokens。 - 智谱 GLM 5.2 推理强度分档:原生智谱渠道支持
reasoning_effort,可自定义思考深度。 - Open Design 接入:AIHubMix 现已成为 Open Design 的内置 BYOK 网关。
- OpenClaw 接入插件修复:aihubmix-auth 已修复,现可稳定使用。
稳定性与修复
- 优化计费精度与缓存计量准确性。
- 修复
/v1/models部分模型缺失。 - 修复若干视频生成与渠道测试问题。
本月新模型(近 20 款)
对话 / 通用- claude-fable-5【已退役】:Claude 最新一代,安全护栏更强(详见 更新日志 · Fable 5 特性说明)。
- minimax-m3、qwen3.7-plus、glm-5.2、豆包 doubao-seed-2-1-pro / doubao-seed-2-1-turbo。
- kimi-k2.7-code、kimi-k2.7-code-highspeed:Kimi 代码系列,含高速版。
- coding-glm-5.2 及免费版 coding-glm-5.2-free。
- 可灵 Kling:文生、图生、多图参考、omni 多模态视频生成。
- happyhorse-1.1:文生(t2v)、参考生成(r2v)、图生(i2v)三档。
- 百度 musesteamer-air-image 图像生成。
- grok-build-0.1、hy3-preview、免费模型 step-3.7-flash-free。
价格与公告
- step-3.7-flash 限时 1 折:输入 0.022 美元 / 百万 token,输出 0.132 美元 / 百万 token。
- 模型下架与自动路由:
claude-opus-4-20250514、claude-sonnet-4-20250514官方 6 月 15 日下架,平台会自动把它们路由到同系列 4-5 版本。
常见问题
本月新增了哪些模型? 近 20 款,涵盖对话(claude-fable-5【已退役】、minimax-m3、qwen3.7-plus、glm-5.2、doubao-seed-2-1 系列)、代码(kimi-k2.7-code 系列、coding-glm-5.2)、视频(可灵 Kling、happyhorse-1.1)与图像(musesteamer-air-image)。 模型智能路由如何使用? 将请求中的模型名设为auto,网关会按请求内容自动选择最优模型,并按实际命中的模型计费,无需改动客户端代码。详见 模型智能路由。
主域名无法访问时怎么办?
可将请求地址替换为备用域名 https://api.inferera.com,端点与能力完全一致,API Key、模型、请求体均无需改动。
step-3.7-flash 的限时优惠价是多少?
输入 0.022 美元 / 百万 token,输出 0.132 美元 / 百万 token。
查看全部模型请访问 模型广场,接入细节详见 文档中心。
更新时间:2026-06-30