All Pages Edit on GitHub

RAG Bad Cases

这份案例库记录 RAG 项目中最常见、也最值得复盘的失败模式。每个 bad case 都包含现象、原因、修复方式和如何避免复发。

1. 检索结果看起来相关,但回答缺少关键条件

现象:

用户问“入职半年有没有年假”,系统回答“员工有年假”,但没有说明“入职满一年后才享有”。

常见原因:

修复方式:

如何避免复发:

2. 检索不到专有名词

现象:

用户问产品代号、工单号、政策编号时,向量检索找不到答案。

常见原因:

修复方式:

如何避免复发:

3. 模型引用了资料,但引用不支持结论

现象:

回答后面有来源,但打开来源发现只和主题相关,并不能证明结论。

常见原因:

修复方式:

如何避免复发:

4. 资料没有答案,模型仍然编造

现象:

知识库没有“报销上限”,模型却回答了一个具体金额。

常见原因:

修复方式:

如何避免复发:

5. 文档更新后,系统仍按旧资料回答

现象:

制度已更新,但问答结果还是旧版本。

常见原因:

修复方式:

如何避免复发:

6. 用户看到不该看的文档

现象:

普通员工问到了管理层文档中的内容。

常见原因:

修复方式:

如何避免复发:

7. Chunk 太大导致成本高且检索不准

现象:

每次回答都塞入大量文本,响应慢、成本高,回答还容易跑偏。

常见原因:

修复方式:

如何避免复发:

8. 多轮对话中“这个”指代丢失

现象:

用户先问“RAG 怎么做”,再问“这个怎么评测”,系统检索不到正确内容。

常见原因:

修复方式:

如何避免复发: