Minimal RAG

这个示例用最少代码解释 RAG 的核心流程：

文档 -> 切分 -> 检索相关片段 -> 拼进 Prompt -> 模型回答

为了让新手容易理解，这个示例先用关键词检索，不强制引入向量数据库。真正项目中可以把 retrieve 替换成 Embedding + Vector Store。

运行方式

cd examples/minimal-rag
python rag_demo.py

你应该观察什么

文档是如何切成 chunk 的
用户问题如何匹配 chunk
Prompt 如何要求模型只基于上下文回答
当上下文没有答案时应该如何拒答

下一步改造

接入 Embedding
使用 pgvector 或 Qdrant
增加引用来源
增加评测集
支持上传 PDF 或 Markdown