手把手教程:用Dify+本地大模型搭建你的私有AI知识库(2026版)
无需OpenAI API,用Dify开源平台搭配Ollama本地模型,30分钟内搭建一个完全私有的企业知识库系统,数据不出本机。
企业数据安全日益严格,越来越多的公司要求AI系统完全本地部署。本文手把手教你用Dify + Ollama搭建一套功能完整的私有知识库。
为什么选择Dify + Ollama
- Dify:开源LLM应用开发平台,内置RAG管线、Agent能力、工作流编排
- Ollama:最流行的本地大模型管理器,支持Llama 4、Qwen3、DeepSeek等主流开源模型
- 优势:完全免费、数据不出本机、可定制、支持私有知识库
第一步:环境准备
硬件要求
- CPU:8核以上(推荐16核)
- 内存:32GB(推荐64GB,运行7B+模型)
- 硬盘:50GB以上可用空间
- GPU(可选):NVIDIA显卡8GB显存以上可大幅提升推理速度
安装Docker(如未安装)
# Ubuntu/Debian
sudo apt update && sudo apt install docker.io docker-compose-v2
sudo systemctl enable --now docker
第二步:安装Ollama并下载模型
# 安装Ollama
curl -fsSL https://ollama.com/install.sh | sh
# 下载推荐模型(三选一,根据硬件选)
ollama pull qwen3:7b # 推荐!中英文都不错,7B参数
ollama pull llama4:8b # 通用能力强
ollama pull deepseek-v3:6.7b # 代码能力强
第三步:部署Dify
git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -d
访问 http://localhost:3000,完成初始化设置。
第四步:配置模型供应商
- 登录Dify后台 → 设置 → 模型供应商
- 添加 Ollama 作为模型供应商
- 配置:
- 模型名称:
qwen3:7b - 基础URL:
http://host.docker.internal:11434 - 模型类型:
LLM
- 模型名称:
- 点击”保存”,然后测试连接
第五步:创建知识库
- 进入”知识库”页面 → “创建知识库”
- 上传文档(支持PDF、Word、TXT、Markdown等格式)
- 选择分段策略:
- 自动分段:适合通用文档
- 自定义分段:按章节分段,精度更高
- 嵌入模型建议选择Ollama的 nomic-embed-text
ollama pull nomic-embed-text - 等待文档向量化完成
第六步:创建AI应用
- 进入”工作室”→ 创建”聊天助手”
- 选择编排方式:基础编排
- 关联知识库:选择上一步创建的知识库
- 设置提示词:
你是公司的内部知识助手。回答必须基于提供的上下文。 如果上下文不足,明确告知用户。 引用来源段落编号。 - 设置召回策略:混合搜索(关键词+向量检索)
- 发布应用
进阶配置
提升回答质量
- Top-K召回:设置为5-8,平衡准确性和覆盖面
- 相似度阈值:0.75以上,低于此值的段落不纳入回答
- 系统提示词:补充角色设定和回答规范
多文档增强
- 设置定时任务同步文档更新
- 使用Dify工作流实现”文档更新→自动向量化→通知管理员”
效果实测
我用一套100份PDF(约2000页)的工程文档进行测试:
- 准确率:92%(上下文相关的问题)
- 响应速度:3-8秒(取决于文档量和模型大小)
- 成本:0元(纯本地运行)
常见问题
Q:文档量很大,Ollama处理速度慢怎么办?
A:升级硬件(加GPU)或改用Qwen3:14B及以上模型。
Q:可以多人同时使用吗?
A:可以,Dify支持多用户和多应用创建,分配不同权限。
Q:支持实时更新文档吗?
A:支持。自动同步需要配合脚本或Dify工作流中的定时触发。
这套方案已经在多家中小企业落地,效果完全满足内部知识问答需求。最重要的是——你的数据完全掌握在自己手中。