再见RAG！AI知识库还得是SAG，又快又准～

7.6

深览指数

科技腾讯新闻·袋鼠帝AI客栈·4小时前·AI 生成

再见RAG！AI知识库还得是SAG，又快又准～

作者回应客户需求，认为传统RAG在多跳推理和调优方面存在根本性局限，并介绍新开源方案SAG。SAG 的核心思路是将文档转化为「事项-实体」索引存入SQL数据库，查询时通过动态SQL的JOIN操作串联跨文档线索，从而精准解决多跳推理问题。作者通过对比FastGPT和GraphRAG，指出SAG在可解释性、调优成本和对弱模型的鲁棒性上更具优势，并提供了一套SAG结合成熟框架的落地建议。本文适合正负责企业知识库选型或调优的技术决策者阅读，以判断SAG是否适用于自身场景。原文 ↗原文 ↗

核心观点

▍传统RAG的「扁平相似度匹配」在多跳推理任务上存在物理上限，而SAG通过将检索过程从「向量语义搜索」转向「SQL实体关联+向量语义搜索」结合，实现了确定性和高精度的跨文档追踪。
▍SAG 将知识图谱的构建从「离线预构建」后置到「查询时动态激活」，避开了GraphRAG昂贵的索引成本和难以维护的全局图结构。

01SAG的检索流程：1. 入库时用AI提取「事项卡片」和「实体」，存入SQL库；2. 查询时，一边做向量搜索，一边从问题中提取实体，用SQL的JOIN语句在已有命中结果中挖出新实体，触发多轮查询，直至找到所有关联文档。
02在MuSiQue（地狱难度RAG测试集）上，SAG的Recall@5达到80.04%，而HippoRAG 2为65.13%，高出约15个百分点。
03SAG的检索链条完全可追溯（SQL调用记录），工程师能直接定位并修复「断在哪一跳」，调优从传统RAG的「黑盒炼丹」变成「找Bug和修Bug」，作者认为能砍掉团队80%的摸索时间。
04SAG不挑向量模型：将其底层的优秀向量模型替换为普通弱模型，SAG准确率几乎不变（约80%），而其他高级RAG方案准确率暴跌近10%。因为SAG的主干力量是确定的SQL实体关联。
05SAG已于约5亿条数据规模的生产环境部署，在线检索延迟保持在秒级以内。
06SAG的文档入库逻辑：用AI将文档内容提炼为完整的「事项卡片」，而不是传统RAG的「切块」操作，避免了因切块导致的关键信息断裂。

反方 / 局限

— 作者指出，SAG目前仍是一套检索架构，而非完整的知识库产品。若从零开始搭建，需自建前端、权限管理、文档解析引擎等，工程量大。建议将其作为MCP工具结合FastGPT使用。

SAG RAG GraphRAG HippoRAG 2 FastGPT 广州智跃深空人工智能科技有限公司 (Zleap)MuSiQue HotpotQA 2WikiMultiHop MCP

14 分钟 · 4 卡片 · 8 资料

读原文 →

再见RAG！AI知识库还得是SAG，又快又准～

前置背景

平行视角

未来推演

延伸追问