model 🤖 AI 摘要 · 2026/5/26 15:00:00
Mistral 开源 8x22B-V2:MoE 效率提升 2.3 倍
Mistral 发布新版 8x22B-V2 模型,每 token 仅激活 39B 参数,推理速度比上代提升 2.3 倍,可在单张 H100 上跑。
来源:Mistral AI
查看原文 →
🤖 AI 摘要:Mistral 8x22B-V2 通过改进 MoE 路由算法,让每个 token 只激活 8 个专家中的 2 个(39B 参数),推理 TPS(每秒 token 数)比 V1 提升 130%。
主要数字:
- MMLU 78.2 · HumanEval 71.5 · MT-Bench 8.7
- 单 H100 推理速度:145 tok/s
- 上下文:128k
- 完全开源(Apache 2.0),可商用
Mistral 同时发布了 配套的 Llama.cpp 量化版本,让单张消费级显卡(如 RTX 4090)也能跑 4-bit 量化版。
编辑批注:开源生态正在快速逼近闭源旗舰。Mistral 这种「轻量 + 高效」路线特别适合企业私有化部署。