7.6
深览指数
科技腾讯新闻·袋鼠帝AI客栈··AI 生成
再见RAG!AI知识库还得是SAG,又快又准~
作者回应客户需求,认为传统RAG在多跳推理和调优方面存在根本性局限,并介绍新开源方案SAG。SAG 的核心思路是将文档转化为「事项-实体」索引存入SQL数据库,查询时通过动态SQL的JOIN操作串联跨文档线索,从而精准解决多跳推理问题。作者通过对比FastGPT和GraphRAG,指出SAG在可解释性、调优成本和对弱模型的鲁棒性上更具优势,并提供了一套SAG结合成熟框架的落地建议。本文适合正负责企业知识库选型或调优的技术决策者阅读,以判断SAG是否适用于自身场景。原文 ↗
核心观点
- ▍传统RAG的「扁平相似度匹配」在多跳推理任务上存在物理上限,而SAG通过将检索过程从「向量语义搜索」转向「SQL实体关联+向量语义搜索」结合,实现了确定性和高精度的跨文档追踪。
- ▍SAG 将知识图谱的构建从「离线预构建」后置到「查询时动态激活」,避开了GraphRAG昂贵的索引成本和难以维护的全局图结构。
- 01SAG的检索流程:1. 入库时用AI提取「事项卡片」和「实体」,存入SQL库;2. 查询时,一边做向量搜索,一边从问题中提取实体,用SQL的JOIN语句在已有命中结果中挖出新实体,触发多轮查询,直至找到所有关联文档。
- 02在MuSiQue(地狱难度RAG测试集)上,SAG的Recall@5达到80.04%,而HippoRAG 2为65.13%,高出约15个百分点。
- 03SAG的检索链条完全可追溯(SQL调用记录),工程师能直接定位并修复「断在哪一跳」,调优从传统RAG的「黑盒炼丹」变成「找Bug和修Bug」,作者认为能砍掉团队80%的摸索时间。
- 04SAG不挑向量模型:将其底层的优秀向量模型替换为普通弱模型,SAG准确率几乎不变(约80%),而其他高级RAG方案准确率暴跌近10%。因为SAG的主干力量是确定的SQL实体关联。
- 05SAG已于约5亿条数据规模的生产环境部署,在线检索延迟保持在秒级以内。
- 06SAG的文档入库逻辑:用AI将文档内容提炼为完整的「事项卡片」,而不是传统RAG的「切块」操作,避免了因切块导致的关键信息断裂。
反方 / 局限
- — 作者指出,SAG目前仍是一套检索架构,而非完整的知识库产品。若从零开始搭建,需自建前端、权限管理、文档解析引擎等,工程量大。建议将其作为MCP工具结合FastGPT使用。
14 分钟 · 4 卡片 · 8 资料
读原文 →