手把手教程:用Dify+本地大模型搭建你的私有AI知识库(2026版)

📅 2026/5/31 ✍️ 小文 📖 约 1 分钟

无需OpenAI API,用Dify开源平台搭配Ollama本地模型,30分钟内搭建一个完全私有的企业知识库系统,数据不出本机。

企业数据安全日益严格,越来越多的公司要求AI系统完全本地部署。本文手把手教你用Dify + Ollama搭建一套功能完整的私有知识库。

为什么选择Dify + Ollama

  • Dify:开源LLM应用开发平台,内置RAG管线、Agent能力、工作流编排
  • Ollama:最流行的本地大模型管理器,支持Llama 4、Qwen3、DeepSeek等主流开源模型
  • 优势:完全免费、数据不出本机、可定制、支持私有知识库

第一步:环境准备

硬件要求

  • CPU:8核以上(推荐16核)
  • 内存:32GB(推荐64GB,运行7B+模型)
  • 硬盘:50GB以上可用空间
  • GPU(可选):NVIDIA显卡8GB显存以上可大幅提升推理速度

安装Docker(如未安装)

# Ubuntu/Debian
sudo apt update && sudo apt install docker.io docker-compose-v2
sudo systemctl enable --now docker

第二步:安装Ollama并下载模型

# 安装Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 下载推荐模型(三选一,根据硬件选)
ollama pull qwen3:7b     # 推荐!中英文都不错,7B参数
ollama pull llama4:8b    # 通用能力强
ollama pull deepseek-v3:6.7b  # 代码能力强

第三步:部署Dify

git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -d

访问 http://localhost:3000,完成初始化设置。

第四步:配置模型供应商

  1. 登录Dify后台 → 设置 → 模型供应商
  2. 添加 Ollama 作为模型供应商
  3. 配置:
    • 模型名称:qwen3:7b
    • 基础URL:http://host.docker.internal:11434
    • 模型类型:LLM
  4. 点击”保存”,然后测试连接

第五步:创建知识库

  1. 进入”知识库”页面 → “创建知识库”
  2. 上传文档(支持PDF、Word、TXT、Markdown等格式)
  3. 选择分段策略:
    • 自动分段:适合通用文档
    • 自定义分段:按章节分段,精度更高
  4. 嵌入模型建议选择Ollama的 nomic-embed-text
    ollama pull nomic-embed-text
  5. 等待文档向量化完成

第六步:创建AI应用

  1. 进入”工作室”→ 创建”聊天助手”
  2. 选择编排方式:基础编排
  3. 关联知识库:选择上一步创建的知识库
  4. 设置提示词:
    你是公司的内部知识助手。回答必须基于提供的上下文。
    如果上下文不足,明确告知用户。
    引用来源段落编号。
  5. 设置召回策略:混合搜索(关键词+向量检索)
  6. 发布应用

进阶配置

提升回答质量

  • Top-K召回:设置为5-8,平衡准确性和覆盖面
  • 相似度阈值:0.75以上,低于此值的段落不纳入回答
  • 系统提示词:补充角色设定和回答规范

多文档增强

  • 设置定时任务同步文档更新
  • 使用Dify工作流实现”文档更新→自动向量化→通知管理员”

效果实测

我用一套100份PDF(约2000页)的工程文档进行测试:

  • 准确率:92%(上下文相关的问题)
  • 响应速度:3-8秒(取决于文档量和模型大小)
  • 成本:0元(纯本地运行)

常见问题

Q:文档量很大,Ollama处理速度慢怎么办?
A:升级硬件(加GPU)或改用Qwen3:14B及以上模型。

Q:可以多人同时使用吗?
A:可以,Dify支持多用户和多应用创建,分配不同权限。

Q:支持实时更新文档吗?
A:支持。自动同步需要配合脚本或Dify工作流中的定时触发。

这套方案已经在多家中小企业落地,效果完全满足内部知识问答需求。最重要的是——你的数据完全掌握在自己手中

📤 分享到