Start Here
这是一条面向 AI 应用工程师的学习路线。你不需要先成为算法研究员,也不需要从训练大模型开始。对大多数开发者来说,更现实的路径是:先学会用模型构建可靠应用,再逐步理解模型、检索、评测和工程化。
先建立一张地图
很多新手一开始会被这些词吓到:LLM、Prompt、Embedding、RAG、Agent、MCP、微调、向量数据库、Function Calling。其实它们可以放进同一条链路里理解:
用户问题
-> Prompt 组织任务
-> 模型理解和生成
-> RAG 补充外部知识
-> Tool/Agent 执行外部动作
-> Evaluation 判断效果
-> Production 保证稳定上线
你不需要一次学完全部内容。最好的方式是先做一个小应用,然后每次加一个能力。
这条路线真正要培养什么能力
AI 应用工程师不是“会写 Prompt 的人”,也不是“知道很多模型名字的人”。更准确地说,你要培养的是把不稳定的模型能力放进稳定软件系统里的能力。
这包括四类能力:
| 能力 | 你要能做到什么 |
|---|---|
| 产品理解 | 判断什么问题适合用 AI,什么问题不适合 |
| 模型协作 | 会组织上下文、设计 Prompt、处理不确定输出 |
| 工程落地 | 会接 API、接数据、接工具、做权限和日志 |
| 质量迭代 | 会评测、复盘 bad case、控制成本和风险 |
很多人学 AI 应用时只学第二类能力,所以容易停留在 demo。真正能上线的项目,通常靠四类能力一起工作。
你需要先具备什么
- 至少熟悉一门编程语言,推荐 Python 或 TypeScript
- 知道 HTTP API、JSON、环境变量和基础数据库概念
- 能看懂简单的后端服务代码
- 愿意用项目驱动学习,而不是只收藏资料
如果你对 API、JSON、后端服务、数据库、权限和数据流还不熟,先读一遍:AI Application Foundations。这页会把 AI 应用开发需要的工程基础串起来,让后面的 LLM、Prompt、RAG 和 Agent 学起来更顺。
最短学习路径
- 先画出一个最小 AI 应用的数据流。
- 用 API 完成一个最小聊天应用。
- 学会 Prompt 的结构化写法。
- 加入知识库,做一个 RAG 问答系统。
- 让模型调用工具,例如搜索、读文件、查数据库。
- 给系统加评测、日志、成本统计和权限控制。
- 部署上线,找真实用户试用。
推荐技术栈
| 场景 | 推荐 |
|---|---|
| 快速原型 | Python + FastAPI + SQLite |
| Web 应用 | Next.js + TypeScript + Postgres |
| 向量数据库 | pgvector、Qdrant、Milvus |
| Agent 框架 | OpenAI Agents SDK、LangGraph、LlamaIndex |
| 文档处理 | Unstructured、MarkItDown、PyMuPDF |
| 评测 | 自定义测试集 + LLM-as-judge + 人工抽检 |
如何选择第一门技术栈
如果你没有强偏好,建议这样选:
- 想最快理解概念:选 Python。生态简单,适合写脚本、RAG、数据处理和评测。
- 想做可用 Web 产品:选 TypeScript + Next.js。前后端一体,适合做作品集。
- 已经有后端经验:沿用你熟悉的语言,把重点放在模型调用、检索和评测。
- 已经有数据库经验:优先用 Postgres + pgvector,减少额外组件。
不要一开始就同时学太多框架。最好的顺序是:先不用框架跑通数据流,再引入框架减少样板代码。
第一个作品建议
做一个“个人知识库问答助手”:
- 支持上传 Markdown、PDF 或网页内容
- 自动切分文档并生成向量
- 用户提问时检索相关片段
- 回答中带引用来源
- 记录用户反馈,持续优化
这个项目足够小,但会覆盖 LLM 应用的核心链路。
一个项目从 0 到 1 的拆解
不要一开始就做完整知识库系统。可以按下面顺序推进:
- 只做一个命令行聊天脚本,确认模型 API 能调用。
- 把 Prompt 抽成模板,加入 system prompt 和输出格式。
- 读取一个本地 Markdown 文件,把内容放进上下文回答。
- 文档变长后,加入简单关键词检索。
- 再加入 Embedding 和向量检索。
- 给回答加来源引用。
- 收集 20 条测试问题,比较修改前后的效果。
- 加 Web 页面、登录、日志和部署。
这样做的好处是每一步都有可见结果,也能清楚知道新增能力解决了什么问题。
第一次调用模型时要理解什么
一次模型调用通常包含:
- model:你选择的模型
- messages:系统指令、用户问题和历史对话
- temperature:输出随机性
- max tokens:最大输出长度
- tools:模型可以调用的外部工具
- response format:输出格式要求
新手不需要马上记住所有参数,但要明白:模型不是魔法盒子,它接收一段上下文,然后根据上下文生成最可能的输出。
学习方法
- 每学一个概念,就做一个 30 分钟小实验
- 每做一个 demo,就写下输入、输出、失败案例
- 遇到模型答错,不要只改一句 prompt,要分析是上下文、检索、工具还是评测出了问题
- 每周整理一次 bad case,它们比成功案例更值钱
推荐的学习笔记格式
每学完一个主题,建议记录这 6 件事:
| 项目 | 记录内容 |
|---|---|
| 概念 | 用自己的话解释它是什么 |
| 作用 | 它解决什么问题 |
| 边界 | 它不能解决什么问题 |
| 实验 | 你亲手跑了什么 |
| 失败 | 出现了哪些 bad case |
| 改进 | 下一步可以怎么优化 |
不要只复制定义。能讲清楚边界和失败案例,说明你真的开始理解它了。
常见误区
- 只收藏资料,不做项目
- 一开始就纠结模型训练
- 只看 Prompt,不学评测和工程化
- 做 demo 时很快,上线时完全没有日志、权限和成本控制
- 过度依赖框架,却不理解数据流
遇到问题时怎么排查
AI 应用出错时,不要只问“是不是模型不行”。可以按这条链路排查:
用户问题是否清楚
-> Prompt 是否明确
-> 上下文是否足够
-> 检索结果是否相关
-> 工具返回是否正确
-> 输出格式是否可解析
-> 后处理和权限是否正确
很多线上问题并不是模型能力不足,而是上下文组织、检索、权限、格式校验或日志缺失导致的。
学完本仓库你应该能做到
- 独立设计一个 AI 应用的基本架构
- 做出一个可用的 RAG 问答系统
- 让模型安全地调用工具
- 给 AI 应用建立最小评测集
- 解释模型成本、延迟和稳定性的来源
- 把项目写进简历并讲清楚技术取舍