model 🤖 AI 摘要 · 2026/5/26 15:00:00

Mistral 开源 8x22B-V2：MoE 效率提升 2.3 倍

Mistral 发布新版 8x22B-V2 模型，每 token 仅激活 39B 参数，推理速度比上代提升 2.3 倍，可在单张 H100 上跑。

来源：Mistral AI 查看原文 →

🤖 AI 摘要：Mistral 8x22B-V2 通过改进 MoE 路由算法，让每个 token 只激活 8 个专家中的 2 个（39B 参数），推理 TPS（每秒 token 数）比 V1 提升 130%。

主要数字：

Mistral 同时发布了配套的 Llama.cpp 量化版本，让单张消费级显卡（如 RTX 4090）也能跑 4-bit 量化版。

编辑批注：开源生态正在快速逼近闭源旗舰。Mistral 这种「轻量 + 高效」路线特别适合企业私有化部署。