🎨 可视化画廊

把抽象概念
做成你能玩的玩具

每一个可视化都可以拖动、点击、修改参数。
选一个让你好奇的开始。

🧠 深度学习

Transformer 全景剖面

逐层展开 GPT-2 的内部结构，看数据如何流过 12 层 Block。

🐥 8 分钟

🧠 深度学习

注意力是怎么"注意"的

输入一句话，逐字查看 Q·K·V 实时计算的注意力权重。

🐣 10 分钟

🦅 大模型

Embedding 空间漫游

把词放进 3D 空间，看相似词如何聚在一起。"king - man + woman = ?"

🐣 7 分钟

📐 数学/优化

梯度下降登山者

拖动起点，看 SGD / Momentum / Adam 在等高线上走出不同轨迹。

🐣 12 分钟

🧠 深度学习

神经网络分类器

鼠标画数据点，看 2 层 MLP 实时学到决策边界。致敬 TF Playground。

🐣 15 分钟

🎨 多模态

Diffusion 去噪可视化

从纯噪声到清晰图像，逐步看每一步去噪过程。

🐥 10 分钟

🧠 深度学习

CNN 卷积核扫描

拖动卷积核滑过图像，实时看每个位置产生的特征值。

🥚 8 分钟

🦅 大模型

RAG 全流程拆解

输入问题，看分块、向量化、检索、重排、生成每一步发生什么。

🐣 12 分钟

📐 数学/优化

Loss 曲面 3D

用 Three.js 渲染损失曲面，亲手感受"鞍点"和"局部最优"的差别。

🐥 15 分钟

🦅 大模型

LLM 怎么"选下一个词"

写一段开头，看模型给出 top-k 候选词及概率。调 temperature 看输出多样性变化。

🐣 6 分钟

🔧

还有更多想法

下一批：Embedding 投影 / Mixture of Experts / 越狱攻防 / KV Cache 内存

把抽象概念 做成你能玩的玩具

Tokenizer Playground

Transformer 全景剖面

注意力是怎么"注意"的

Embedding 空间漫游

梯度下降登山者

神经网络分类器

Diffusion 去噪可视化

CNN 卷积核扫描

RAG 全流程拆解

Loss 曲面 3D

LLM 怎么"选下一个词"

把抽象概念
做成你能玩的玩具