All Pages Edit on GitHub

Start Here

这是一条面向 AI 应用工程师的学习路线。你不需要先成为算法研究员,也不需要从训练大模型开始。对大多数开发者来说,更现实的路径是:先学会用模型构建可靠应用,再逐步理解模型、检索、评测和工程化。

先建立一张地图

很多新手一开始会被这些词吓到:LLM、Prompt、Embedding、RAG、Agent、MCP、微调、向量数据库、Function Calling。其实它们可以放进同一条链路里理解:

用户问题
  -> Prompt 组织任务
  -> 模型理解和生成
  -> RAG 补充外部知识
  -> Tool/Agent 执行外部动作
  -> Evaluation 判断效果
  -> Production 保证稳定上线

你不需要一次学完全部内容。最好的方式是先做一个小应用,然后每次加一个能力。

这条路线真正要培养什么能力

AI 应用工程师不是“会写 Prompt 的人”,也不是“知道很多模型名字的人”。更准确地说,你要培养的是把不稳定的模型能力放进稳定软件系统里的能力。

这包括四类能力:

能力 你要能做到什么
产品理解 判断什么问题适合用 AI,什么问题不适合
模型协作 会组织上下文、设计 Prompt、处理不确定输出
工程落地 会接 API、接数据、接工具、做权限和日志
质量迭代 会评测、复盘 bad case、控制成本和风险

很多人学 AI 应用时只学第二类能力,所以容易停留在 demo。真正能上线的项目,通常靠四类能力一起工作。

你需要先具备什么

如果你对 API、JSON、后端服务、数据库、权限和数据流还不熟,先读一遍:AI Application Foundations。这页会把 AI 应用开发需要的工程基础串起来,让后面的 LLM、Prompt、RAG 和 Agent 学起来更顺。

最短学习路径

推荐技术栈

场景 推荐
快速原型 Python + FastAPI + SQLite
Web 应用 Next.js + TypeScript + Postgres
向量数据库 pgvector、Qdrant、Milvus
Agent 框架 OpenAI Agents SDK、LangGraph、LlamaIndex
文档处理 Unstructured、MarkItDown、PyMuPDF
评测 自定义测试集 + LLM-as-judge + 人工抽检

如何选择第一门技术栈

如果你没有强偏好,建议这样选:

不要一开始就同时学太多框架。最好的顺序是:先不用框架跑通数据流,再引入框架减少样板代码。

第一个作品建议

做一个“个人知识库问答助手”:

这个项目足够小,但会覆盖 LLM 应用的核心链路。

一个项目从 0 到 1 的拆解

不要一开始就做完整知识库系统。可以按下面顺序推进:

这样做的好处是每一步都有可见结果,也能清楚知道新增能力解决了什么问题。

第一次调用模型时要理解什么

一次模型调用通常包含:

新手不需要马上记住所有参数,但要明白:模型不是魔法盒子,它接收一段上下文,然后根据上下文生成最可能的输出。

学习方法

推荐的学习笔记格式

每学完一个主题,建议记录这 6 件事:

项目 记录内容
概念 用自己的话解释它是什么
作用 它解决什么问题
边界 它不能解决什么问题
实验 你亲手跑了什么
失败 出现了哪些 bad case
改进 下一步可以怎么优化

不要只复制定义。能讲清楚边界和失败案例,说明你真的开始理解它了。

常见误区

遇到问题时怎么排查

AI 应用出错时,不要只问“是不是模型不行”。可以按这条链路排查:

用户问题是否清楚
  -> Prompt 是否明确
  -> 上下文是否足够
  -> 检索结果是否相关
  -> 工具返回是否正确
  -> 输出格式是否可解析
  -> 后处理和权限是否正确

很多线上问题并不是模型能力不足,而是上下文组织、检索、权限、格式校验或日志缺失导致的。

学完本仓库你应该能做到