跳到主要内容

RAGFlow 教程

检索增强生成引擎

RAGFlow 是一款基于深度文档理解的开源检索增强生成(RAG)引擎。它为用户提供了一套完整的解决方案,将非结构化数据转化为可靠的知识问答服务。无论你是希望构建企业知识库,还是搭建智能客服系统,RAGFlow 都能帮助你从海量文档中精准提取答案,并提供可追溯的引用来源。

本教程将带你从零开始,全面了解 RAGFlow 的架构设计、部署方式和使用技巧,帮助你快速掌握这一强大的 RAG 引擎。


学习目标

通过本教程的学习,你将能够:

  • 理解 RAGFlow 架构 — 掌握系统各组件的职责与数据流向
  • 独立完成部署 — 使用 Docker Compose 在本地环境成功运行 RAGFlow
  • 完成端到端问答 — 从上传文档到获得基于文档的智能回答
  • 配置本地 LLM — 将 Ollama 等本地大模型与 RAGFlow 集成
  • 使用进阶功能 — 掌握 Agentic 工作流、HTTP API 和多种分块策略

章节概览


前置知识

在开始本教程之前,建议你具备以下基础:

领域建议掌握的内容
Docker了解容器基本概念,能运行 docker compose 命令
命令行熟悉 Linux/macOS 终端或 Windows PowerShell 基本操作
LLM 基础了解大语言模型的基本原理(如 GPT、Llama 等)
RAG 概念了解检索增强生成的基本思路(可选,教程中会介绍)
💡 提示

即使你对 RAG 概念不太熟悉也没关系,本教程的架构概览章节会为你建立必要的背景知识。