HelloAI
model 🤖 AI 摘要 · 2026/5/26 15:00:00

Mistral 开源 8x22B-V2:MoE 效率提升 2.3 倍

Mistral 发布新版 8x22B-V2 模型,每 token 仅激活 39B 参数,推理速度比上代提升 2.3 倍,可在单张 H100 上跑。

来源:Mistral AI 查看原文 →

🤖 AI 摘要:Mistral 8x22B-V2 通过改进 MoE 路由算法,让每个 token 只激活 8 个专家中的 2 个(39B 参数),推理 TPS(每秒 token 数)比 V1 提升 130%。

主要数字:

  • MMLU 78.2 · HumanEval 71.5 · MT-Bench 8.7
  • 单 H100 推理速度:145 tok/s
  • 上下文:128k
  • 完全开源(Apache 2.0),可商用

Mistral 同时发布了 配套的 Llama.cpp 量化版本,让单张消费级显卡(如 RTX 4090)也能跑 4-bit 量化版。

编辑批注:开源生态正在快速逼近闭源旗舰。Mistral 这种「轻量 + 高效」路线特别适合企业私有化部署。