量子位 ·

小米大模型“杀”进第一梯队：代码能力开源第一，智商情商全在线

💡 原文中文，约4600字，阅读约需11分钟。

📝

内容提要

小米新开源模型MiMo-V2-Flash参数为309B，展现出高效能，推理加速达2.6倍，具备出色的代码能力和良好的情感理解，成功进入开源第一梯队，助力小米转型为“大模型公司”。

🎯

🔎

小米的MiMo-V2-Flash模型通过5:1混合注意力机制和MTP多层Token预测技术，实现了推理加速和高效能的结合。这种技术创新不仅提升了模型的计算效率，还降低了显存占用，为开发者提供了更具性价比的选择。

MiMo-V2-Flash在代码生成和情感理解方面表现出色，能够在复杂的编程任务中生成完整代码，同时在与人类的交互中展现出高情商。这种双重能力使其在实际应用中更具竞争力，适应多种场景需求。

小米正在从硬件制造商向大模型公司转型，MiMo-V2-Flash是其战略布局的重要一步。通过构建强大的AI基础设施，小米希望实现数字世界与物理世界的无缝连接，推动智能硬件的智能化进程。

❓

MiMo-V2-Flash模型参数为309B，展现出高效能，推理加速达2.6倍，具备出色的代码能力和良好的情感理解。

MiMo-V2-Flash在开源模型中获得广泛好评，成功跻身开源第一梯队，表现优异。

该模型采用MTP多层Token预测技术和5:1混合注意力机制，有效提升推理效率。

小米计划推出多模态模型，进一步推动其向大模型公司的转型，打造智能中枢。

在SWE-Bench Verified评测中，MiMo-V2-Flash获得73.4%的高分，超越多个竞争对手。

该模型具备良好的情感理解能力，能够进行人文交互，展现出高情商的回复。

🏷️