Start Here

这是一条面向 AI 应用工程师的学习路线。你不需要先成为算法研究员，也不需要从训练大模型开始。对大多数开发者来说，更现实的路径是：先学会用模型构建可靠应用，再逐步理解模型、检索、评测和工程化。

先建立一张地图

很多新手一开始会被这些词吓到：LLM、Prompt、Embedding、RAG、Agent、MCP、微调、向量数据库、Function Calling。其实它们可以放进同一条链路里理解：

用户问题
  -> Prompt 组织任务
  -> 模型理解和生成
  -> RAG 补充外部知识
  -> Tool/Agent 执行外部动作
  -> Evaluation 判断效果
  -> Production 保证稳定上线

你不需要一次学完全部内容。最好的方式是先做一个小应用，然后每次加一个能力。

这条路线真正要培养什么能力

AI 应用工程师不是“会写 Prompt 的人”，也不是“知道很多模型名字的人”。更准确地说，你要培养的是把不稳定的模型能力放进稳定软件系统里的能力。

这包括四类能力：

能力	你要能做到什么
产品理解	判断什么问题适合用 AI，什么问题不适合
模型协作	会组织上下文、设计 Prompt、处理不确定输出
工程落地	会接 API、接数据、接工具、做权限和日志
质量迭代	会评测、复盘 bad case、控制成本和风险

很多人学 AI 应用时只学第二类能力，所以容易停留在 demo。真正能上线的项目，通常靠四类能力一起工作。

你需要先具备什么

至少熟悉一门编程语言，推荐 Python 或 TypeScript
知道 HTTP API、JSON、环境变量和基础数据库概念
能看懂简单的后端服务代码
愿意用项目驱动学习，而不是只收藏资料

如果你对 API、JSON、后端服务、数据库、权限和数据流还不熟，先读一遍：AI Application Foundations。这页会把 AI 应用开发需要的工程基础串起来，让后面的 LLM、Prompt、RAG 和 Agent 学起来更顺。

最短学习路径

先画出一个最小 AI 应用的数据流。
用 API 完成一个最小聊天应用。
学会 Prompt 的结构化写法。
加入知识库，做一个 RAG 问答系统。
让模型调用工具，例如搜索、读文件、查数据库。
给系统加评测、日志、成本统计和权限控制。
部署上线，找真实用户试用。

场景	推荐
快速原型	Python + FastAPI + SQLite
Web 应用	Next.js + TypeScript + Postgres
向量数据库	pgvector、Qdrant、Milvus
Agent 框架	OpenAI Agents SDK、LangGraph、LlamaIndex
文档处理	Unstructured、MarkItDown、PyMuPDF
评测	自定义测试集 + LLM-as-judge + 人工抽检

如何选择第一门技术栈

如果你没有强偏好，建议这样选：

想最快理解概念：选 Python。生态简单，适合写脚本、RAG、数据处理和评测。
想做可用 Web 产品：选 TypeScript + Next.js。前后端一体，适合做作品集。
已经有后端经验：沿用你熟悉的语言，把重点放在模型调用、检索和评测。
已经有数据库经验：优先用 Postgres + pgvector，减少额外组件。

不要一开始就同时学太多框架。最好的顺序是：先不用框架跑通数据流，再引入框架减少样板代码。

第一个作品建议

做一个“个人知识库问答助手”：

支持上传 Markdown、PDF 或网页内容
自动切分文档并生成向量
用户提问时检索相关片段
回答中带引用来源
记录用户反馈，持续优化

这个项目足够小，但会覆盖 LLM 应用的核心链路。

一个项目从 0 到 1 的拆解

不要一开始就做完整知识库系统。可以按下面顺序推进：

只做一个命令行聊天脚本，确认模型 API 能调用。
把 Prompt 抽成模板，加入 system prompt 和输出格式。
读取一个本地 Markdown 文件，把内容放进上下文回答。
文档变长后，加入简单关键词检索。
再加入 Embedding 和向量检索。
给回答加来源引用。
收集 20 条测试问题，比较修改前后的效果。
加 Web 页面、登录、日志和部署。

这样做的好处是每一步都有可见结果，也能清楚知道新增能力解决了什么问题。

第一次调用模型时要理解什么

一次模型调用通常包含：

model：你选择的模型
messages：系统指令、用户问题和历史对话
temperature：输出随机性
max tokens：最大输出长度
tools：模型可以调用的外部工具
response format：输出格式要求

新手不需要马上记住所有参数，但要明白：模型不是魔法盒子，它接收一段上下文，然后根据上下文生成最可能的输出。

学习方法

每学一个概念，就做一个 30 分钟小实验
每做一个 demo，就写下输入、输出、失败案例
遇到模型答错，不要只改一句 prompt，要分析是上下文、检索、工具还是评测出了问题
每周整理一次 bad case，它们比成功案例更值钱

项目	记录内容
概念	用自己的话解释它是什么
作用	它解决什么问题
边界	它不能解决什么问题
实验	你亲手跑了什么
失败	出现了哪些 bad case
改进	下一步可以怎么优化

常见误区

只收藏资料，不做项目
一开始就纠结模型训练
只看 Prompt，不学评测和工程化
做 demo 时很快，上线时完全没有日志、权限和成本控制
过度依赖框架，却不理解数据流

遇到问题时怎么排查

AI 应用出错时，不要只问“是不是模型不行”。可以按这条链路排查：

用户问题是否清楚
  -> Prompt 是否明确
  -> 上下文是否足够
  -> 检索结果是否相关
  -> 工具返回是否正确
  -> 输出格式是否可解析
  -> 后处理和权限是否正确

很多线上问题并不是模型能力不足，而是上下文组织、检索、权限、格式校验或日志缺失导致的。

学完本仓库你应该能做到

独立设计一个 AI 应用的基本架构
做出一个可用的 RAG 问答系统
让模型安全地调用工具
给 AI 应用建立最小评测集
解释模型成本、延迟和稳定性的来源
把项目写进简历并讲清楚技术取舍