跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

AIHubMix 致力于让人人都能用上真正好用的 AI——持续引入新的模型提供商,主动补贴推理成本,将分散的免费资源整合到统一平台,让用户把精力放在探索和创造上,而不是应付繁琐的接入与计费问题。

AIHubMix 免费模型汇总

AIHubMix 目前提供 24+ 免费模型,涵盖 OpenAI、Google、智谱、Kimi、MiniMax、小米等主流厂商,持续更新。

通用对话模型

覆盖 GPT-4o、GPT-4.1 全系列及 Gemini Flash,适用于日常问答、内容生成、文档处理等场景。gpt-4o-free 支持图文混合输入,gemini-3-flash-preview-free 具备超长上下文能力,其余模型在速度与能力之间各有侧重,可按场景灵活选用。
模型特点
gpt-4o-free多模态,支持图文输入
gpt-4.1-free复杂指令跟随,长文生成
gpt-4.1-mini-free速度与能力均衡
gpt-4.1-nano-free轻量高频任务
gemini-3-flash-preview-free超长上下文,多模态输入
glm-4.7-flash-free响应快,多语言支持
mimo-v2-flash-free低延迟对话
ling-2.6-flash-free上下文连贯性强

编程专用模型

免费层中模型数量最多的类别,汇聚 Kimi、MiniMax、智谱 GLM、Qwen 等多个编程专项系列。kimi-for-coding-free 在多文件上下文理解上表现突出,coding-glm-5.1-free 是 GLM 编程系列当前的最强免费版本,qwen3.6-plus-preview-free 在算法推导与逻辑分析上尤为可靠。
模型特点
kimi-for-coding-free多文件上下文,重构与调试
k2.6-code-preview-free算法与系统级代码
coding-minimax-m2-freeMiniMax 编程系列
coding-minimax-m2.1-freeMiniMax 编程系列
coding-minimax-m2.5-freeMiniMax 编程系列
coding-minimax-m2.7-freeMiniMax 编程系列最新版
coding-glm-4.6-freeGLM 编程系列
coding-glm-4.7-freeGLM 编程系列
coding-glm-5-freeGLM 编程系列
coding-glm-5-turbo-freeGLM 编程加速版
coding-glm-5.1-freeGLM 编程系列最强免费版
qwen3.6-plus-preview-free算法推导,多语言逻辑
step-3.5-flash-free轻量补全,低延迟

图像生成模型 - Nano Banana 2

gemini-3.1-flash-image-preview-free**(Nano Banana 2)**是 Google DeepMind 于 2026 年 2 月发布的新一代图像生成模型,将 Pro 级画质与 Flash 的速度结合,生成一张 4K 图像仅需 4–6 秒。 与传统图像生成模型不同,在对话中自然提出需求,模型即可生成图像,并支持多轮连续编辑——例如先生成一张产品图,再用一句话将背景改为日落场景。

智能体与推理

小米 MiMo 系列针对复杂推理与工具调用进行专项优化,适合需要多步规划与自主执行的智能体工作流。
模型特点
xiaomi-mimo-v2-pro-free高级推理,函数调用
xiaomi-mimo-v2.5-free多步任务编排

AIHubMix热门免费模型🔥

coding-glm-5.1-free

智谱 AI 于 2026 年 4 月发布,参数规模约 754B。SWE-bench Pro 得分 58.4%,超越 GPT-5.4(57.7%)与 Claude Opus 4.6(57.3%),是首个登顶该榜单的开源模型。代码生成、调试与多语言理解能力全面,适合对编程能力有较高要求的开发者场景。

coding-glm-5-free

GLM-5.1 的前代版本,745B 参数 MoE 架构(44B 激活),于 2026 年 2 月发布。SWE-bench Verified 得分 77.8%,Terminal Bench 2.0 等 Agent 编程榜单达到开源最优,综合编程能力与 Claude Opus 4.5 相当。

gpt-4.1-free Hot

上下文 1M · 延迟 0.529S · 吞吐 72 TPS · 输入输出均免费
OpenAI 2025 年 4 月发布的新一代旗舰模型。编程与指令跟随全面超越 GPT-4o,SWE-bench Verified 得分 54.6%,IFEval 达到 87.4%。1M 超长上下文尤其适合大规模文档处理与复杂 Agent 场景。免费版本来自 Azure 部署,响应速度快,稳定性高。

xiaomi-mimo-v2-pro-free New

上下文 256K · 延迟 1.673S · 吞吐 41 TPS · 输入输出均免费
小米推出的大型推理模型,MoE 架构,总参数超 1T,推理激活约 42B。全球智能指数排名第 8,中文模型第 2。编程能力超越 Claude Sonnet 4.6,Agent 综合能力接近 Opus 4.6,擅长复杂代码生成与多工具长链任务。

xiaomi-mimo-v2.5-free

MiMo 系列当前最强版本,Artificial Analysis 智能指数得分 54。在通用 Agent 能力、复杂软件工程与长时程任务上较 V2-Pro 全面提升,ClawEval、SWE-bench Pro 等核心榜单均有领先表现,支持超过千次工具调用的超长 Agent 工作流。

如何获取免费模型 API Key

通过 AIHubMix 接入免费模型的完整流程如下:
  1. aihubmix.com 注册账户
  2. 进入 API Keys 页面,创建 API Key(格式为 sk-...
  3. 从免费模型目录中选择目标模型,发起调用

使用场景

在 Claude Code 中使用

Claude Code 是 Anthropic 官方推出的智能编程命令行工具,近年来已成为许多开发者日常工作流的核心。只需简单配置,就能将 AIHubMix 的免费模型接入 Claude Code 的完整能力体系。 实际使用中,可以按任务类型灵活分配模型:日常代码生成交给 kimi-for-coding-freecoding-glm-5.1-free,文档写作和注释生成使用 gpt-4.1-free,复杂任务的规划与编排交由 xiaomi-mimo-v2-pro-free 处理。合理搭配之下,整套开发辅助流程的推理成本可以降至零。配置方法详见 Claude Code 接入文档,也支持在 Claude Desktop 桌面端直接使用。

在AI Agents 智能体中使用

OpenClaw 是 2025 年 11 月发布的开源自主 AI 智能体平台,目前拥有超过 320 万用户。它支持 WhatsApp、Telegram、Slack、Discord 等几乎所有主流通讯渠道,可以让 AI 智能体在常用的工作平台上直接执行任务,无需单独打开应用。通过AIHubMix,xiaomi-mimo-v2-pro-freecoding-glm-5.1-free 均可无缝作为后端模型运行,函数调用、多轮上下文管理和结构化输出完全正常。 Hermes Agent 来自 NousResearch,是专为工具调用和结构化输出深度优化的智能体框架。其核心能力在于通过 execute_code 工具将多步骤流水线压缩为单次推理调用,大幅减少任务完成所需的来回轮次。对于需要严格 JSON 格式输出的自动化流水线场景,Hermes Agent 与 AIHubMix 的组合尤为适合——平台的限速轮转机制可确保长时间运行的任务不会因单一提供商触及配额而中断。

与开源客户端及 Github 项目配合使用

AIHubMix 作为多款主流开源应用的 API 提供商,可在应用内直接选择接入,无需任何代码改动:
  • 桌面对话客户端Cherry Studio 是目前最受欢迎的本地 AI 对话客户端之一,界面简洁,多模型管理方便,选择AIHubMix 作为AP 提供商可免费使用 GPT-4.1、Gemini Flash 等模型。
  • 多模型代理与翻译LiteLLM 可统一管理多个免费模型的调用与负载均衡;NextAI Translator 支持接入免费模型完成高质量多语言翻译任务。

常见问题

Q: 为什么选择AIHubMix? A: 与 OpenRouter 等同类平台相比,AIHubMix 提供同样稳定的统一接口,汇聚 500+ 全球主流模型,其中包括持续更新的 24+ 免费模型。付费模型价格更具竞争力,平台由美国 AIHubMix, LLC 正式运营,获各大云厂商官方授权,在稳定性与合规性上值得信赖。 Q:AIHubMix 上的免费模型是否有使用期限? A:平台提供的免费模型在对应配额范围内持续可用,使用限制以每分钟请求数或每日 Token 数为单位,细节见于模型页面。 Q:免费层中,综合编程能力最强的模型是哪些? A:截至2026年5月,从当前基准评测来看,coding-glm-5.1-free 表现最为突出——SWE-bench Pro 得分 58.4%,超越 GPT-5.4 和 Claude Opus 4.6,是目前首个登顶该榜单的开源模型,代码生成与调试能力全面。kimi-for-coding-free 在多文件上下文理解和代码重构场景中表现尤为出色。如果任务侧重算法推导或数学逻辑,qwen3.6-plus-preview-free 是更合适的选择。 Q:免费模型是否适用于生产环境? A:对于中等规模的生产流量,可以考虑使用免费模型。关键在于合理规划配额使用策略。AIHubMix 的自动故障转移机制可在多个提供商之间均衡负载,提升有效可用配额。对于流量较大的生产场景,建议将核心推理任务配置付费配额,将辅助性任务(批量摘要、日志分析、非关键路径处理等)路由至免费模型,以实现成本与稳定性的平衡。
如需进一步了解具体模型的性能参数、配额限制或集成方案,欢迎参阅 AIHubMix 官方文档。完整免费模型目录请访问 aihubmix.com/models 参考资料 最新更新日期:2026 年 5 月 6 日