把时间放在 2026-04-23 UTC,RAGFlow 给出的 AI-China 信号,并不在于 retrieval-augmented generation 已经变得流行。这一点早已显明。真正的信号在于,一支带有上海基础设施背景的团队,正在把 RAG 包装成一层文档操作系统:摄入、解析、检查、检索、引用、记忆,再把结果开放给 agents 使用。[1][3][5]
这个区分很重要,因为多数企业 RAG 系统的失败,并不发生在最后一句回答上。失败常常更早出现:扫描 PDF、表格密集的手册、合同附件、过期知识库页面,被处理成断裂文本,来源关系也随之变得模糊。RAGFlow 的公开材料反复回到 "quality in, quality out"、深度文档理解、template-based chunking、融合检索与 citation grounding。[1][5] 狭义地看,这是产品话术;放在栈证据里看,它说明 RAG 的难处正在被前移到文档管线。
图片说明:题图来自 Wikimedia Commons 上一张美国国会图书馆卡片目录真实照片。它并不描绘 RAGFlow 或 InfiniFlow。它贴近本文,是因为本文讨论的是作为机构记忆的检索:抽屉、记录、标签,以及在任何答案生成之前,先让文档变得可查找的长期劳动。[6]
产品边界从 retrieval 之前开始
RAGFlow 把自己描述为一款开源 RAG engine,把 RAG 与 agent capabilities 融合,为 LLM 创建 context layer。[1] 官网进一步收紧了这个定位:ETL for AI data、hybrid search、unified AI agent orchestration 被放在同一个系统里,而并非事后拼接的几件工具。[3]
这个顺序很关键。在许多 RAG 演示里,最显眼的单位是聊天框。到了 RAGFlow,真正更耐看的单位是 dataset。仓库 README 指向从复杂格式非结构化数据中抽取知识、多路召回与融合 reranking、可配置的 LLM 与 embedding models,以及接入业务系统的 API。[1] 阿里云创新中心的产品资料则用中文 ToB 产品语言说出同一件事:文档知识库、智能文档解析、智能表格解析、基于 Agent 的高级 RAG、自动化工作流与文件管理,都位于产品描述内部。[5]
这让 RAGFlow 成为一条栈与供应链故事。这里被管理的 "supply",并不只是模型 token 或向量容量,而是可用的组织上下文。一家公司要让 agent 穿过维修手册、新药研发报告或法律判例语料,首先需要把这些文档作为数据来控制。RAGFlow 的意义,就在于它把解析模板、chunk 检查、检索组件与 agent workflow 放进同一块操作表面。
Release notes 显示移动方向
2026 年 4 月 21 日的 v0.25.0 release notes,是一张紧凑的路线图。这一版加入七个预置 ingestion pipeline templates、可发布的 agent apps、sandbox code execution 与 chart generation、user-level memory storage and retrieval,以及通过 OpenClaw 访问 RAGFlow datasets。[2] 它还加入 Seafile、RSS、DingTalk AI Table,并给 GitHub 数据源补上删除文件同步能力。[2]
这些变化并非界面装饰。预置 ingestion templates 表明,团队把文档摄入看成可重复的 workflow design,而并非一次性上传按钮。可发布的 agent apps 表明,RAGFlow 希望检索表面转化成可复用的业务软件。Memory APIs 与 user-level memory,则把 context layer 推近 agent continuity。OpenClaw dataset access 尤其值得注意:它允许其他 agent surface 进入 RAGFlow datasets,而并非把上下文困在 RAGFlow UI 里面。[1][2]
更早的 v0.24.0 与 v0.23.0 notes,也在加强同一条移动方向。它们加入 memory management APIs、batch metadata management、保留 sessions 与 dialogue history 的 chat-like agent conversation interface、multi-sandbox support、面向 deep-research scenarios 的 retrieval strategy 优化、webhook-triggered agents、每个 Agent component 配置多个 Retrieval components、ingestion 中的 table-of-contents extraction、parent-child chunking,以及文件解析时自动生成 metadata。[2]
由此展开的形态很清楚:RAGFlow 正从知识库问答扩展为一层 context engine,可以被管理、被审计,并被 agents 反复调用。技术重心正在从 "retrieve a few chunks" 移到 "operate a corpus"。
Document engine 选择有战略意义
RAGFlow 的基础设施选择同样重要。README 说明,系统默认使用 Elasticsearch 存储全文与向量,也可以把 document engine 切到 Infinity。[1] Infinity 同样来自 InfiniFlow,它把自己描述为面向 LLM applications 的 AI-native database,支持 dense vector、sparse vector、tensor 或 multi-vector,以及 full text 之间的 hybrid search。[4]
这种 hybrid retrieval 姿态,是 production RAG 的中心问题。Dense embeddings 很有用,但企业文档里充满编号、条款、产品名、表格标签、缩写与精确短语,单靠语义检索会把这些东西磨得模糊。一个把全文、向量、稀疏与 tensor retrieval 都作为一等通道的 document engine,会给 RAGFlow 处理混杂企业材料时提供更可信的底座。[3][4]
操作要求也写得很实在。README 给出的基线包括 4 CPU cores、16 GB RAM、50 GB disk、Docker 24.0.0 或以上、Docker Compose v2.26.1 或以上;只有在使用 code-executor sandboxing 时才需要 gVisor。[1] 它还写到 vm.max_map_count 设置、面向 x86 的预构建镜像、默认使用 Elasticsearch,以及切换 Infinity 时需要注意 -v 停容器会清空 volumes。[1]
这些细节有价值,因为它们把采用叙事压回地面。RAGFlow 并非披着开源外衣的浏览器 SaaS 承诺,而是一套服务栈,里面有 storage、object storage、task execution、parser workloads、model-provider configuration,以及可选 sandboxing。评估它的团队需要平台所有权,而不只是 prompt-engineering 热情。
为什么它属于 AI-China 地图
RAGFlow 适合放进 AI-China 覆盖,因为它展示了不同于 frontier-model announcements 的竞争通道。阿里云创新中心的资料把 InfiniFlow 放在 Infinity 与 RAGFlow 周围,强调企业级 RAG,并说明两位联合创始人有搜索引擎、向量数据库、数据库内核与人工智能经验。[5] 这种背景也出现在产品自身:重点落在 retrieval infrastructure,而不只是模型品牌。
这也解释了为什么 RAGFlow 需要和两个邻近故事分开看。它不同于 ModelScope 这样的 model hub,后者的中心问题是 weights、datasets、evaluation 与 managed deployment 的分发。它也不同于 Milvus 这样的 vector database,后者的中心问题是存储与查询能力。RAGFlow 位于这些层之上,在那里,文档被清洗、切块、引用、检索,并作为可用上下文交给 agents。
短期值得观察的第一件事,是 RAGFlow 的 OpenClaw integration 能否成为真正的跨表面 contract。如果聊天系统、IM clients 或 workflow runners 里的 agents,能够稳定管理 datasets、上传并解析文件、通过 RAGFlow 执行 semantic search,那么 RAG 平台就会从一个 destination app,转成许多 agent products 的 backend。[1][2]
第二件值得观察的事,是 parser accountability。团队如果能够看见一张表格在哪里被切开、一段 image context window 从何而来、为什么 parent-child chunk 被选中,以及哪一段 source passage 支撑了回答,RAGFlow 的价值就会上升。正是这部分栈,把 RAG 从 "the model found something" 推向 "the system can show its work"。
更窄的结论是,RAGFlow 值得持续跟踪,因为它把 RAG 当作文档基础设施来处理。在中国 AI 栈里,这一点会和下一次模型发布同样重要:agents 只有在知识已经变得可解析、可检索、可归因、可治理之后,才能真正作用于企业知识。
来源
- InfiniFlow,
infiniflow/ragflowGitHub repository,README 与 setup notes(RAGFlow 定位、关键功能、部署前提、Docker 设置、Elasticsearch 与 Infinity document-engine 选项)。 - InfiniFlow,RAGFlow release notes(v0.25.0、v0.24.0 与 v0.23.0 变更,涵盖 ingestion templates、memory、OpenClaw dataset access、agent execution、metadata 与 retrieval updates)。
- RAGFlow official homepage,围绕 ETL for AI data、hybrid search 与 unified AI agent orchestration 的产品定位。
- InfiniFlow,
infiniflow/infinityGitHub repository,README 与 Infinity AI-native database、hybrid search lanes 的项目说明。 - 阿里云创新中心,《RAGFlow企业级RAG引擎》(2024 年 6 月 26 日;InfiniFlow 公司与产品背景、RAGFlow 企业场景、文档解析、表格解析与 agent workflow 描述)。
- Wikimedia Commons,"File:2011 Library of Congress USA 5466788868 card catalog.jpg"(Ted Eytan 摄影,2011 年 2 月 21 日;本文题图)。