RAGFlow 是由 infiniflow 团队开源的一个用于构建 RAG(检索增强生成)系统的开发框架。它强调工程化能力,支持模块化流程编排、检索/生成解耦、上下文链路可视化和可调试性等特性。你可以把它看作是一个专注于搭建稳定、可控、可追踪的知识问答系统的流水线工具。
与 LangChain、LlamaIndex 这类通用型框架相比,RAGFlow 更偏向“后端基础设施”,追求可复现、可测试、可观测的 RAG 流程,尤其适合团队内部打造复杂问答系统、AI Copilot 和企业知识搜索等场景。
核心功能:
- 深度文档解析:能处理各类复杂格式数据(如多格式文件、结构化内容等),通过深度理解提取关键信息,为 AI 任务提供高质量上下文。
- 知识库构建与管理:支持创建专属知识库,可对上传文件进行解析、存储和维护。
- 检索增强生成联动:与 LLM 集成后,能基于检索到的知识生成带准确引用的回答。
部署与集成:提供 Docker Compose 部署方式,可与各类 LLM 集成。
你可以用 RAGFlow 来做什么?
- 搭建模块化的企业知识库问答系统
RAGFlow 支持对文档预处理、分块策略、嵌入生成、索引结构等每一步进行模块化配置,并支持替换组件、插入自定义节点。你可以精准控制知识库构建流程,打造适配自己业务的 RAG 系统。
- 构建“可调试”的 RAG 调用链
调一个 RAG 系统最难的是哪里错了?RAGFlow 内置链路可视化和数据追踪能力,让你清楚知道是哪个检索 query 没命中、哪一轮上下文太长被截断,帮助你快速优化整个回答流程。
- 组合 Agent + RAG 架构
你可以将 RAGFlow 作为一个组件集成进更大的 LLM Agent 系统中,例如结合 Dify 或 Lobe Chat,通过插件或 API 调用方式实现复杂意图识别 → 检索 → 回答的三段式闭环。特别适合构建财务助手、客服助手等强业务感知型 Agent。