RAGFlow 技术方案
# RAGFlow 技术方案
1. 覆盖范围
RAGFlow 是 LLM-WIKI MVP 的智能体与 RAG 平台,负责支撑文档迭代、知识问答、引用生成和反馈闭环。
| LLM-WIKI 产品 | RAGFlow 支撑能力 | 产品特性 |
|---|---|---|
| 文档迭代智能体 | Agent、知识库、工具调用、任务工作流 | 文档整理、补全、重组、改进建议 |
| 知识索引产品 | 文档解析、chunk、检索、重排 | RAG 召回和引用定位 |
| 问答产品 | Chat/API、引用回答、无答案处理 | 面向人和智能体的问答能力 |
| 反馈与任务产品 | 问答结果、引用、低置信反馈 | 生成文档改进任务 |
| 权限与身份产品 | RAGFlow API token、工作区权限 | 智能体调用边界 |
| 配置管理产品 | 数据集、模型、检索策略配置 | 可审计的问答策略 |
2. 如何购买或获取
2.1 MVP 决策
当前已经部署 RAGFlow,因此 MVP 直接复用现有 RAGFlow 环境。
RAGFlow 的获取方式分两类:
| 方式 | 适用场景 | MVP 建议 |
|---|---|---|
| 已部署自建 RAGFlow | 已有服务器、数据和网络环境 | 采用 |
| RAGFlow Cloud/托管形态 | 希望减少运维 | 暂不作为 MVP 前提 |
2.2 成本边界
MVP 成本主要来自:
- 已部署 RAGFlow 的服务器资源。
- RAGFlow 调用的模型 API。
- 文档解析、embedding、问答生成产生的 token 或推理成本。
- Meilisearch 作为独立站内全文搜索服务会产生额外成本。
- 向量存储不作为独立 MVP 产品单列,按 RAGFlow 实施依赖处理;当前倾向优先评估 pgvector。
3. 如何开发
3.1 LLM-WIKI 与 RAGFlow 的边界
RAGFlow 负责“智能处理知识”,LLM-WIKI 负责“治理知识生产”。
| 边界 | RAGFlow | LLM-WIKI |
|---|---|---|