HelloAI ← 可视化画廊
🦅 大模型 · 6 分钟

LLM 怎么"选下一个词"

LLM 每次都给你一个 候选词的概率分布。 选哪个?由 temperature / top-k / top-p 这几个参数决定。 调一下,看它对输出"多样性"的影响。

提示词(看模型怎么续写)
候选词及概率(已按 temperature 缩放)
连续采样输出(每次都按当前分布抽一次):
0.7
越低:更确定、更死板(贪婪)
越高:更多样、更随机(疯狂)
10
只在概率最高的 k 个 词中选,剩下的丢掉。
0.9
只在累计概率前 p 的词中选(也叫 nucleus sampling)。
📌 经验值
• 严谨任务(代码、SQL):T=0.0-0.3
• 通用对话:T=0.7
• 创意写作:T=0.9-1.2
• 实验性:T > 1.5(会胡言乱语)
🌡

temperature

把 logits 除以 T 再 softmax。T < 1 让分布更尖锐(最高概率词更可能被选);T > 1 让分布更平(罕见词也有机会)。

🔢

top-k

只保留概率最高的 k 个词,其它的概率清零。k=1 退化为"贪婪"(永远选最高)。

📊

top-p (nucleus)

按概率从高到低累加,累加到 p(如 0.9)时停止。常被认为比 top-k 更鲁棒——分布尖锐时自动收紧,分布平时自动放宽。