HelloAI
🎨 可视化画廊

抽象概念 做成你能玩的玩具

每一个可视化都可以拖动、点击、修改参数。选一个让你好奇的开始。

⭐ 精选
🦅 大模型 · 入门玩具

Tokenizer Playground

同一句话,被 GPT-4、Claude、Llama 切成的 token 数量为什么差这么多? 为什么调用 API 时中文比英文贵 2 倍?亲手输入文字,立刻看清。

🕒 5 分钟玩转·🐣 入门
打开可视化 →
输入: "Hello, 世界! 🌍"
Hello , ▁世 ! ▁🌍
GPT-4
6 tok
Claude
5 tok
Llama
8 tok
Q K
start minimum
king queen man woman apple banana cherry dim 1 dim 2
3×3 kernel 特征图
the · 0.42 a · 0.28 an · 0.15 this · 0.08 temperature = 0.7
t=1000 t=750 t=500 t=250 t=0 从噪声到图像
🎨 多模态

Diffusion 去噪

从纯噪声开始,50 步生成图像。看 Stable Diffusion / Sora 的核心思路。

🐥 🕒 10 分钟
query 向量库 LLM 检索 → 重排 → 生成
无 Cache O(n²) 有 Cache O(n) 缓存命中省下重复计算
GPU0GPU1 GPU2GPU3 bubble = 调度空闲 时间 →
"the cat" Router E1 E2 E3 E4 E5 E6 E7 E8 每个 token 走 2 个专家
小模型一次猜 5 个 tok1 tok2 tok3 tok4 tok5 大模型并行验证 3/5 接受 → 加速 3×
The cat dog sat ate ran barked k=2 保留每层最优 2 条
Teacher 软分布 Student 学到 KL 70B → 7B 温度 T = 3.0
the of and 中国 def code 42 2024 SolidGoldMagikarp ⚠ 玄学 token 英文 60% 中文 20% 代码 10%