🎓 学习路径
一张地图,
从入门走到前沿
8 个层级、145 篇文章。每篇都标好难度(🥚🐣🐥),
你可以从 L0 一路读完,也可以挑感兴趣的跳着学。
🥚
L0
AI 启蒙
零基础读得懂
12 篇
- 01 🥚 12 分钟AI、机器学习、深度学习、大模型,到底什么关系?一篇文章拆清楚四个被搞混最多的词,从此你不会再被任何吹牛和黑话唬住。
- 02 🥚 15 分钟一篇文章读完 AI 简史:从图灵到 ChatGPT70 年压成 15 分钟。不讲流水账,只挑改变了游戏规则的 11 个时刻。
- 03 🥚 14 分钟AI 现在到底能做什么、不能做什么——用真实例子说话不要再听吹牛和黑稿了,我们一条一条核对:哪些事 AI 已经做得比你好,哪些事它彻底做不了。
- 04 🥚 13 分钟"幻觉"是什么、为什么会发生、怎么减轻为什么 AI 会一本正经地胡说八道?这不是 bug,这是它本来就这样工作。理解了机制,你就知道怎么用。
- 05 🥚 12 分钟提示词入门 10 招:让 AI 干活立刻精准 10 倍不用学黑话,10 个动作就够。这一篇让你的 AI 使用水平直接超过 80% 的人。
- 06 🥚 10 分钟"智能"到底是什么?——从图灵测试到今天的争论一个我们以为很清楚、其实从来没说清楚过的词。当你下次纠结"AI 算不算真的智能",先看完这篇。
- 07 🥚 8 分钟5 分钟跑通你的第一个 AI 对话理论讲完了,上手最快。手把手注册、登录、第一句话怎么说。
- 08 🥚 12 分钟AI 会取代我的工作吗?——一个分类框架不要问"会不会取代你",问"会取代你工作里的哪些部分"。这一篇给你一个能套用一辈子的判断框架。
- 09 🥚 11 分钟ChatGPT / Claude / Gemini 怎么选?——一份不站队的横评不吹也不黑,把三大模型的优劣摆在桌面上。哪个最适合你,取决于你要干什么。
- 10 🥚 10 分钟AI 安全:你和 AI 聊的话,去哪了?你贴进 ChatGPT 的合同、病历、产品机密——它们怎么处理?谁能看到?这些事知道了,你才能放心用。
- 11 🥚 14 分钟AI 词汇表:写给文科生的 30 个核心术语Token、Embedding、Transformer、RAG、Fine-tuning……这些每天在群里飞的黑话,一次性给你讲完。
- 12 🥚 8 分钟L0 毕业了:下一步学什么?恭喜读完启蒙路径。这一篇帮你规划下一步——是继续往深里学,还是横着拓宽,还是直接动手做项目。
🐣
L1
数学与 Python
少而美的预备
10 篇
- 01 🐣 8 分钟数学不发愁:这本来该是数学课,但我们换个学法被高中数学伤过没关系。我们用图、动画、Python 代码把 AI 数学讲清楚——不会的不要先怕,是教材写得不行而已。
- 02 🐣 14 分钟线性代数:用图片和位置讲明白向量和矩阵所有 AI 的本质都是矩阵运算。这一篇不讲行列式不讲特征值,只让你"看见"向量在干什么。
- 03 🐣 13 分钟导数与梯度:"学习"的数学定义"训练神经网络" 的本质就是导数。把这个词搞懂,AI 的训练流程在你眼里就再不神秘了。
- 04 🐣 12 分钟概率与最大似然:为什么 ML 是个概率问题所有 ML 模型其实都在干同一件事:寻找让"看到这些数据"的概率最大的参数。这个观点一旦你 get 了,整个 ML 都通透了。
- 05 🐣 13 分钟信息论:熵、交叉熵、KL 散度的直觉损失函数为什么长 -log P 这样?这一篇从信息论角度回答。理解了,你看到任何损失函数都不再陌生。
- 06 🐥 16 分钟链式法则与反向传播:手算一个 3 层网络把 L1 前 5 篇的所有数学武器组合起来——让我们手算一遍真实神经网络的梯度。
- 07 🐣 10 分钟Python 速成(一):30 分钟从零到能写函数只讲 ML 用得到的 Python 子集——不教 OOP,不教装饰器,不教 generator。够用就好。
- 08 🐣 11 分钟NumPy 数组运算:让 Python 像 MATLAB 一样会做矩阵NumPy 是所有 ML 代码的地基。这一篇让你的"循环式思维"升级为"向量化思维"——快 100 倍的那种。
- 09 🐣 9 分钟Pandas 数据处理:DataFrame 是 ML 数据的标准载体看到 CSV、Excel 这些"表格数据",先用 Pandas 装起来再说。这是 ML 工程师每天用的工具。
- 10 🐣 14 分钟PyTorch 基础:张量、自动求导、你的第一个神经网络把 L1 全部的数学和 Python 武器组合起来——这是你的"AI 工程师"入门仪式。
🐥
L2
经典机器学习
深度学习的根基
9 篇
- 01 🐣 11 分钟监督 / 无监督 / 强化:机器学习的三大世界观所有机器学习算法都属于这三类之一。理解这个分类,你立刻能给任何算法"找它的家"。
- 02 🐣 11 分钟线性回归:最简单也最深刻的 ML 模型你以为线性回归很简单?神经网络的最后一层、几乎所有 ML 的起点——都是它。
- 03 🐣 10 分钟逻辑回归与分类:从回归到决策名字叫"回归"其实是分类。在神经网络出来之前,逻辑回归是工业界分类的事实标准——今天仍然是 baseline。
- 04 🐣 11 分钟决策树:最直观可解释的 ML 算法一连串"是不是"问题,组成一棵决策的树。它是 XGBoost、LightGBM 等竞赛王者算法的基石。
- 05 🐣 13 分钟随机森林 + Boosting:让一群弱学习器变成超人单棵树平庸,一群树投票就能逆天。Kaggle 十年霸主 XGBoost 的来历,就在这一篇。
- 06 🐣 10 分钟K-Means 聚类:最经典的无监督算法没标签也能学。K-Means 是用户分群、图像压缩、市场分析的瑞士军刀——20 行代码就能写。
- 07 🐣 14 分钟评估指标 + 过拟合 + 正则化:让模型不犯傻的工程实战会训模型不算啥。会判断模型"行不行"、知道为啥不行、怎么修——才是真正的 ML 工程师。
- 08 🐣 11 分钟SVM 支持向量机:经典 ML 里的几何派深度学习火之前,SVM 统治了 2000-2010 整整一个时代。今天它仍然是小数据集和文本分类的最优选之一。
- 09 🐣 16 分钟优化器深度解析:SGD / Momentum / Adam 为什么是这样你以为梯度下降只是"沿梯度反方向走"——其实有 10 多种花式走法。Adam 凭什么成为深度学习默认款?
🧠
L3
深度学习核心
含 Transformer 解剖
6 篇
- 01 🐣 12 分钟从感知机到多层神经网络:深度学习的起点所有神经网络都是从一个 1958 年的简单模型扩展来的。这一篇讲清楚"神经元"到底是个啥。
- 04 🐣 12 分钟RNN / LSTM 兴衰:序列模型简史2017 年 Transformer 出现前,所有处理语言/语音的 AI 都靠 RNN 和它的衍生品。理解它的兴衰,才理解为什么 attention 是革命。
- 05 🐣 18 分钟注意力机制详解:从直觉到完整推导Attention is all you need. 这一篇带你从"它到底在干嘛"到"它的每行公式",一次性吃透 Transformer 的核心。
- 06 🐣 15 分钟CNN 卷积原理:从滤镜到 ResNet在 Transformer 称霸前,CNN 是计算机视觉的统治者。它今天仍然是处理图像的标配。这一篇讲清楚"卷积"到底是什么。
- 08 🐥 15 分钟完整 Transformer 架构:把所有积木组合起来注意力是核心,但 Transformer 还有位置编码、FFN、残差连接、LayerNorm。这一篇把它们组合成一个完整可跑的模型。
- 09 🐣 12 分钟BERT vs GPT:两大 LLM 流派的本质区别都是 Transformer,为啥一个做"理解"一个做"生成"?两者的训练目标差一个根本性的设计选择。
🦅
L4
LLM 与生成式 AI
大模型时代的全部
13 篇
- 01 🐣 16 分钟LLM 是怎么炼成的:Pretrain → SFT → RLHF 全流程"训练一个 ChatGPT" 不是一步,是三步。每一步用完全不同的数据和目标。看完你能跟工程师对话。
- 02 🐣 14 分钟Prompt 进阶技巧:CoT / Self-Consistency / Tree of Thoughts / ReflexionL0-05 教你 10 个基础招。这一篇讲学术研究里的"硬核" prompt 工程——能让 GPT-4 在数学题上从 50% 升到 85%。
- 02 🐣 14 分钟Tokenizer 与 BPE:LLM 看到的不是字,是 token为什么 GPT 把"strawberry"切成 4 个 token?为什么数错"strawberry 有几个 r"?这些都和 tokenizer 有关。
- 03 🐣 17 分钟RAG 从 0 到 1:让 LLM 基于你的数据回答企业 AI 应用 90% 都是 RAG。这一篇带你搭一个能跑的 RAG 系统——从分块到部署。
- 04 🐥 15 分钟Agent 构建详解:让 LLM 自己干活从"问一句答一句的对话"到"能连续工作 4 小时的同事"——Agent 是 LLM 应用工程的下一步。
- 05 🐥 13 分钟LoRA 微调入门:让大模型"特化"成你需要的样子不用重训整个 70B 模型,只调几百万个参数,一张消费级显卡就能微调 LLM。
- 06 🐣 11 分钟In-Context Learning:为什么 LLM 看几个例子就会GPT-3 让所有人惊讶的能力——不微调,只给几个例子就能学。它是怎么工作的?这一篇用研究解读。
- 07 🐣 11 分钟MCP 协议详解:AI 世界的 USB 接口Anthropic 2024 提出的 MCP——让任何工具能接入任何 LLM。一年时间成为 AI Agent 生态的事实标准。
- 08 🐣 13 分钟LLM 评估:从 MMLU 到真实业务怎么知道你的 LLM 应用"好不好"?这一篇讲学术 benchmark + 工程评估的完整工具栈。
- 09 🐣 12 分钟Tool Use 工程实战:让 LLM 真正会用工具LLM 能用工具——但要让它"用得稳、用得对、用得省"是另一门工程艺术。这一篇讲实战。
- 10 🐥 13 分钟Multi-Agent 系统:让 AI 团队协作一个 Agent 够强了吗?很多场景下不够——需要多个 Agent 分工。AutoGen、CrewAI 等框架开启了"AI 团队"时代。
- 11 🐣 12 分钟MCP 工具开发:手把手做一个自己的 MCP serverL4-07 讲了 MCP 是什么。这一篇手把手教你写一个能让 Claude / Cursor 直接用的 MCP server。
- 12 🐣 12 分钟LLM 成本优化:从 prompt 到部署的 10× 省钱方法LLM 调用又贵又快——一不小心就把 AWS 账单炸了。这一篇讲实战中的成本管控技巧。
🎨
L5
多模态与前沿
Diffusion / 视频 / 3D
6 篇
- 01 🐣 13 分钟多模态总览:AI 如何同时"看、听、读"GPT-4o 能识别你画的草图、Sora 能生成视频——这些"多模态"AI 是怎么做到的?这一篇打开全景图。
- 02 🐥 15 分钟Diffusion 数学:从加噪到生成Stable Diffusion、DALL·E 3、Sora 都基于扩散模型。这一篇讲清楚它的核心数学——用最少的公式。
- 03 🐣 13 分钟ViT 与 CLIP:让 Transformer 看图把图像切成 patch,喂给 Transformer——视觉领域 2020 年最大的范式转变。
- 04 🐣 11 分钟Whisper:让 AI 听懂 99 种语言OpenAI 开源的 Whisper 是当下最强语音识别。手机录音转文字、会议纪要、字幕生成——背后几乎都是它。
- 05 🐣 11 分钟TTS 语音合成:从拼接到神经合成从机器人腔到逼真人声——TTS 走过的路。VALL-E 让 3 秒声音克隆任何人——这个能力的两面性。
- 06 🐥 13 分钟视频生成:从 Sora 到现代视频 AISora、Runway Gen-3、Veo、Kling……2024-2026 视频生成爆发。这一篇讲技术原理 + 工程细节 + 商业格局。
🛡️
L6
AI 安全与对齐
不可绕开的话题
7 篇
- 01 🐣 12 分钟为什么需要 AI 对齐:从对错到价值观能力越强的 AI,对齐越关键。这一篇讲清楚"对齐"到底是什么,为什么它是 AI 时代最重要的研究方向之一。
- 02 🐥 12 分钟RLHF 与 Constitutional AI:两大对齐方法对比OpenAI 用 RLHF,Anthropic 用 CAI。它们都让 LLM "听话",但思路完全不同。
- 03 🐥 13 分钟红队与越狱:攻击 LLM 的方法与防御AI 安全的"反派"视角——专门找模型漏洞的人在做什么。理解攻击才能防御。
- 04 🐥 13 分钟机制可解释性:看见神经元在想什么LLM 是黑盒——但研究者已经能从几百亿参数里"读出"具体的概念了。这一篇带你认识 AI 内部的"心理学"研究。
- 05 🐣 12 分钟偏见与公平:AI 学到的不止是规则,还有人类的"暗面"训练数据是人类社会的镜像——AI 学到的"模式"包含了所有偏见、刻板印象、不公平。这一篇直面这个问题。
- 06 🐣 13 分钟AI 政策与监管:EU AI Act / 美国 EO / 中国办法对照AI 公司和应用面临的法律义务正在快速演化。这一篇给你全球三大法域的对照表 + 影响。
- 07 🐣 12 分钟AI 安全研究入门:怎么进入这个方向想做 AI 安全研究?这一篇讲方向、机构、起步项目、推荐阅读——这是 2026 年最稀缺的人才方向之一。
⚙️
L7
系统与工程化
把模型真正用起来
7 篇
- 01 🐣 12 分钟GPU 速览:为什么 AI 离不开它A100、H100、B200 是什么?为啥 AI 用 GPU 不用 CPU?这一篇打开硬件的黑盒。
- 02 🐥 14 分钟分布式训练:DP / DDP / FSDP / Tensor Parallel 怎么选一张 H100 装不下 70B 模型。怎么把训练任务分给几千张卡?这一篇梳理 4 种主流并行策略。
- 03 🐥 14 分钟推理优化:vLLM / 量化 / 投机解码 / KV Cache训完模型只是开始。让 LLM 在生产环境跑快、跑省、跑稳,是另一套工程艺术。
- 04 🐥 14 分钟量化深度解析:GPTQ / AWQ / FP8 / GGUF 全谱让 70B 模型塞进 24GB 显存——量化是消费级硬件跑大模型的关键。这一篇详解各家方案。
- 05 🐥 13 分钟模型部署与服务化:从训完到上线训出来一个模型只是开始。怎么把它变成一个 24/7 稳定、便宜、可扩展的服务?这一篇讲生产工程。
- 06 🐥 14 分钟训练优化进阶:让大模型训得动梯度检查点 / 混合精度 / Activation Recomputation / ZeRO Offload——这些工程技巧让 70B 模型在单卡上能微调。
- 07 🐣 12 分钟监控与可观测性:LLM 应用的生产管理一个 LLM 产品上线后,怎么知道它"行不行"?慢了、错了、贵了、被攻击了?这一篇讲监控栈。