RAG 全链路
学习生产级 RAG 管线的每个阶段。
每个页面都会讲清核心原则、参数取舍、厂商实践、关键论文和可落地的最佳实践。
阶段 01
文档解析
解析把 PDF、网页、Office、图片和表格转成规范文本与结构化元数据。好的解析会保留标题层级、页码、表头、图注和来源锚点,让后续检索能准确引用。
阶段 02
文本切分
切分决定检索单元,直接影响召回、上下文完整性、延迟、索引大小和重排序成本。
阶段 03
向量模型
Embedding 把文本、图片或多模态内容映射到向量空间,模型选择决定语义召回、跨语言能力、成本和重建索引频率。
阶段 04
索引构建
索引组织向量和关键词信号。Flat 强调精确,HNSW 与 IVF-PQ 用少量召回损失换延迟和内存效率。
阶段 05
召回策略
召回选择候选上下文。向量检索找语义相似,BM25 保留精确词,混合检索兼顾两者,多查询扩展覆盖模糊意图。
阶段 06
重排序
重排序器用更强的交叉注意力或 late-interaction 模型重新打分候选,常用于提升 top-context 精度。
阶段 07
生成增强
生成把证据组织成可读答案。上下文压缩、查询改写、HyDE、Self-RAG 和 CRAG 用于改善输入质量或答案校验。
阶段 08
评估系统
RAG 评估要拆开检索质量和生成质量,同时关注离线黄金集、线上 trace、忠实度、相关性、延迟和成本。