- 桌面端 AI 客户端——像 ChatGPT 客户端一样开箱即用,本地存储
- 私有 RAG 系统——上传 PDF/Word/网页,AI 基于这些文档回答你的问题
- 多用户协作平台(Docker 自托管)——团队共享知识库 + 权限管理
| 维度 | 详情 |
|---|---|
| 官网 | anythingllm.com |
| GitHub | Mintplex-Labs/anything-llm(40k+ ⭐) |
| 协议 | MIT,完全开源 |
| 支持平台 | 桌面端:macOS / Windows / Linux;服务端:Docker |
| 价格 | 桌面版完全免费;Docker 自托管免费;云服务可选付费 |
核心能力清单
- 多格式文档导入:PDF、Word、Excel、CSV、纯文本、Markdown、代码文件、整个网站
- Workspace 机制:每个工作区是独立知识库,文档/对话/模型互不污染
- 多模型 LLM 支持:OpenAI、Anthropic、Google、Azure、AWS Bedrock、Ollama、LM Studio,以及任意 OpenAI 兼容端点( AIHubMix 入口)
- 多 Embedder 支持:OpenAI、Cohere、Voyage、本地模型(如 nomic-embed-text、bge-m3)
- 内置向量数据库:默认 LanceDB(零配置),也可接 Pinecone、Chroma、Weaviate、Qdrant 等
- Agent 能力:在 RAG 之外让模型调用工具——网页抓取、SQL 查询、自定义脚本
- API 服务:暴露 OpenAI 兼容接口,可被 n8n、Make、Raycast 等工具反向调用
AnythingLLM 在 RAG 工具谱里的位置
| 工具 | 定位 | 适合谁 |
|---|---|---|
| LangChain / LlamaIndex | RAG 框架(写代码) | 开发者,要从 0 搭流水线 |
| Dify / FastGPT | RAG 平台(可视化工作流) | 需要 Agent 编排、多步骤工作流的中小团队 |
| AnythingLLM | 开箱即用的 RAG 客户端 | 想直接传文档对话、不想搭建后端的个人或团队 |
| Ollama + Open WebUI | 纯本地 LLM 推理界面 | 想完全离线、不接 API 的极客 |
通常使用方法
AnythingLLM 官方网址:AnythingLLM 进入下图所示的设置页面:
LLM 提供商选择 Generic OpenAI(通用 Openai)
- Base URL 一栏输入下方的网址:
- APIkey 输入本站的 Key
- Chat Model Name 一栏输入自己需要用的模型名称。
- 注 Token context window 和 Max Tokens 根据模型不同可以填不同的大小。
非 openai 模型使用方法
模型服务商选择 Generic OpenAI 不变,在 Chat Model Name 一栏手动修改所需模型名称即可。打开网站模型广场页面即可复制你想要使用的模型名称。
Docker 部署给团队用
桌面版是单机使用,团队需要 AnythingLLM Docker 镜像。Docker 版本的核心区别:- 多用户登录,管理员可控权限
- Workspace 可在用户间共享(只读/可写)
- 文档解析、向量化运行在服务端
- LLM 与 Embedder 配置由管理员统一管理——也就是说,只要管理员配好一个 AIHubMix Key,全团队成员都能用
http://localhost:3001,登录后在系统设置里按上文配置 AIHubMix 即可。
常见故障排查
问题:文档上传了,提问时模型说”找不到相关信息” 90% 的情况是 Embedder 没配置好,或者 chunk size 太大。检查:- Embedder 是否真的设置成了向量模型(不是 Chat 模型)
- 文档是否真的被向量化(在 Workspace 设置里看 “Pinned Documents” 列表)
- 提问时是否在正确的 Workspace 里(每个 Workspace 文档独立)
Generic OpenAI选对了吗?选成OpenAI会忽略 Base URL- Base URL 是
https://aihubmix.com/v1(带/v1),不要漏 - Chat Model Name 与 AIHubMix 实际支持的模型 ID 一致(去
aihubmix.com复制) - AIHubMix 余额是否充足
- 检查模型是不是
gpt-5/o3/deepseek-reasoner这种推理模型——RAG 场景下确实需要推理时,慢是正常的;只是问”文档里 X 是什么”这种简单检索,换成gpt-4o-mini或claude-haiku-4-5立刻就快 - 检查 Token context window 是否设太大,导致每次请求要塞海量上下文
- 检查 Embedder——
text-embedding-3-small对中文已经不错,但本地bge-m3对中文更优 - 检查 chunk 大小——中文建议 chunk size 设为 300–500 字符,过大会稀释相关性
- 检查文档质量——PDF 表格、扫描件需要先 OCR
参考资料
- AnythingLLM 官网:anythingllm.com
- AnythingLLM 文档:docs.anythingllm.com
- AIHubMix 模型列表与 Key 管理:aihubmix.com
- AnythingLLM Docker Hub:hub.docker.com/r/mintplexlabs/anythingllm
更新时间:2026-06-01