RAG Playground
架构对比

可视化对比 RAG 方案模板。

选择一个预设,查看质量、延迟、成本、运维和控制力画像,并把它作为实验台调参起点。

经济型 RAG 架构

面向内部知识助手和小型语料的低成本基线。

放到实验台试试

推荐组合

递归切分
text-embedding-3-small
HNSW
混合检索
无重排序

配置说明

选择递归切分和 text-embedding-3-small,是为了减少索引成本并保持足够的通用语义召回。HNSW 提供交互式延迟,混合检索补足产品名和编号等精确匹配。不启用重排序可以把链路保持简单,适合先建立评测基线。

适用场景

适合 1 万到 30 万个 chunk 的内部文档、FAQ 和轻量客服建议。质量要求中等、预算敏感、团队希望先快速上线再逐步加重排序时,可以从这个模板开始。

成本与延迟

约 $0.006-$0.018 / 次问答

p50 0.7-1.4 秒,p95 1.8-3.0 秒

质量72
延迟88
成本92
运维86
控制70