架构对比
可视化对比 RAG 方案模板。
选择一个预设,查看质量、延迟、成本、运维和控制力画像,并把它作为实验台调参起点。
经济型 RAG 架构
面向内部知识助手和小型语料的低成本基线。
推荐组合
递归切分
text-embedding-3-small
HNSW
混合检索
无重排序
配置说明
选择递归切分和 text-embedding-3-small,是为了减少索引成本并保持足够的通用语义召回。HNSW 提供交互式延迟,混合检索补足产品名和编号等精确匹配。不启用重排序可以把链路保持简单,适合先建立评测基线。适用场景
适合 1 万到 30 万个 chunk 的内部文档、FAQ 和轻量客服建议。质量要求中等、预算敏感、团队希望先快速上线再逐步加重排序时,可以从这个模板开始。成本与延迟
约 $0.006-$0.018 / 次问答
p50 0.7-1.4 秒,p95 1.8-3.0 秒
质量72
延迟88
成本92
运维86
控制70