每一个可视化都可以拖动、点击、修改参数。
选一个让你好奇的开始。
同一句话,被 GPT-4、Claude、Llama 切成的 token 数量为什么差这么多? 为什么调用 API 时中文比英文贵 2 倍?亲手输入文字,立刻看清。
逐层展开 GPT-2 的内部结构,看数据如何流过 12 层 Block。
输入一句话,逐字查看 Q·K·V 实时计算的注意力权重。
把词放进 3D 空间,看相似词如何聚在一起。"king - man + woman = ?"
拖动起点,看 SGD / Momentum / Adam 在等高线上走出不同轨迹。
鼠标画数据点,看 2 层 MLP 实时学到决策边界。致敬 TF Playground。
从纯噪声到清晰图像,逐步看每一步去噪过程。
拖动卷积核滑过图像,实时看每个位置产生的特征值。
输入问题,看分块、向量化、检索、重排、生成每一步发生什么。
用 Three.js 渲染损失曲面,亲手感受"鞍点"和"局部最优"的差别。
写一段开头,看模型给出 top-k 候选词及概率。调 temperature 看输出多样性变化。