《基于大型语言模型的检索增强生成综述》笔记

基于大型语言模型的检索增强生成综述 进阶 RAG 范式与模块化 RAG 表 1 RAG 方法总结 RAG 过程 文献 检索增强生成方法 检索预处理 SKR[30]、Adaptive-RAG[31] 基于问题精准的文本解析 检索预处理 DenseX[32]、TableGPT[33]、Iseeq[34]、knowledgpt[35]、G-Retriever[36] 基于外部检索源的文本解析 检索预处理 LLAMAi[37]、Small2Big[38]、Meta-Chunking[39]、GLMwCFiCR[40]、RAAT[41] Chunk 分割(动态分块、元数据增强) 嵌入表示 C-Pack[46]、RetroMAE-2[47]、REPLUG[48]、Arl2[49]、Promptagator[50]、BGE[51]、AngIE[52]、ListT5[53] 微调嵌入(领域适配、对齐生成器) 索引 HyDE[54] 分层索引(假设文档嵌入优化) 索引 RAPTOR[55] 树形索引(分层摘要树) 索引 KGP[56] 知识图谱(KG)索引(多文档逻辑关系建模) 查询 RAG-Fusion[57] 多响应扩展(并行子查询) 查询 LTMP-CLR[58] 子查询(最小到最大提示分解) 查询 RRR[28]、BEQUE[59] 查询转换 / 重写(LLM 驱动的长尾查询优化) 查询 Step-back prompt[26]、FCTG-ICRA[60]、DPR[61] 查询路由(动态路径选择) 外部适配器 UP-RISE[62] 轻量级提示检索器(零样本提示池) 外部适配器 Search-Adaptor[63]、PRCA[64]、CRAG[65] 特定任务检索器(插件式适配器) 外部适配器 GenRead[66]、PKG[67] 引入 LLMs 生成器(替代传统检索器) 检索信息生成 RAG-Fusion[57]、Filter-Reranker[68]、G-RAG[69]、RankRAG[70] 重排(LLM+SLM 协同排序) 检索信息生成 Lingua[71]、Longllmlingua[72]、FILCO[73]、RECOMP[74]、ACD-RAG[75] 选择性上下文(噪声过滤与压缩) 检索信息生成 RAAT[39]、IBP-ENFoRAG[76]、Chatlaw[77] 信息过滤(LLM 自评相关性) 提示输出 URR-RAIC[78] 微调数据(多样化标题增强) 提示输出 SANTA[79]、DFK-TOD[80]、RA-DIT[81] 强化学习 / 对齐(KL 散度对齐检索 - 生成偏好) 高级流程优化 Efficient RAG [85]、Rat [88] 等 迭代检索(多轮精炼查询) 高级流程优化 IRCoT[89]、ToC[90] 递归检索(链式思维 + 澄清树) 高级流程优化 Self-RAG[95]、IM-RAG[98] 自适应增强(反射令牌自主决策) 表 2 RAG 开源框架 名称 项目地址 简介 LlamaIndex2 https://github....

August 1, 2025 · 4602 words · Kurong