爱范儿 ·

小米突然发布新模型：媲美 DeepSeek-V3.2，把手机的性价比卷到 AI

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

小米发布了开源模型MiMo-V2-Flash，参数达到3090亿，采用专家混合架构，推理速度为150 tokens/秒，成本低至0.1美元/百万token。该模型在数学推理和编程能力上表现优异，支持深度思考和联网搜索，适用于多种开发环境，标志着小米在AI领域的重要进展。

🎯

🔎

MiMo-V2-Flash采用了混合滑动窗口注意力架构，这种设计显著降低了计算量和存储需求，使得长文本处理能力得以提升。通过只关注最近的128个token，模型在保持性能的同时，减少了近6倍的KV缓存存储量。这一创新为处理复杂任务提供了更高的效率，值得开发者关注。

小米的MiMo-V2-Flash以0.1美元/百万token的低成本和73.4%的编程能力得分，重新定义了开源大模型的性价比。这一举措可能会促使其他公司在AI领域加大投入，推动整个行业的技术进步和竞争格局的变化。

小米在技术报告中提到，MiMo-V2-Flash与顶尖闭源模型仍有差距，但通过扩大模型规模和训练算力，他们计划逐步缩小这一差距。这表明小米在AI领域的长期战略布局，未来可能会推出更强大的模型，值得持续关注。

❓

MiMo-V2-Flash模型参数达到3090亿，采用专家混合架构，推理速度为150 tokens/秒，成本低至0.1美元/百万token。

MiMo-V2-Flash在数学推理和编程能力测试中表现突出，得分超越所有开源模型，编程能力得分为73.4%。

该模型采用混合滑动窗口注意力架构和轻量级多Token预测技术，计算量和存储需求大幅降低，推理速度提升2到2.6倍。

MiMo-V2-Flash采用MIT开源协议，并在Hugging Face上发布。

小米的战略目标是通过MiMo-V2-Flash为其硬件生态提供强大的AI底座，推动AI技术的全面发展。

MiMo-V2-Flash与Claude Code、Cursor、Cline等主流开发环境无缝配合，支持256k的超长上下文窗口。

🏷️