量子位 ·

全球开源大模型杭州霸榜被终结，上海Minimax M2发布即爆单，百万Tokens仅需8元人民币

💡 原文中文，约2500字，阅读约需6分钟。

📝

内容提要

上海发布的Minimax M2开源模型以61分成为开源模型第一，突破智力、成本和速度的限制。其编程能力和推理速度优于Claude 3.5，成本仅为8%。M2支持多种工具调用，表现出色，目前限时免费使用。

🎯

🔎

Minimax M2在编程能力和推理速度上表现优异，尤其在Agent任务中展现出强大的工具使用和深度搜索能力。这使得M2在国内外模型中脱颖而出，尤其适合需要高效编程和复杂任务处理的应用场景。

M2的定价策略极具竞争力，每百万输入Token仅需0.3美元，输出Token为1.2美元，成本仅为Claude 3.5的8%。这种低成本高性能的组合，可能会吸引更多开发者和企业选择M2进行项目开发，推动开源模型的普及。

M2采用全注意力机制而非混合注意力，尽管在某些长程依赖任务上可能存在局限，但其选择适合自身需求的方式，显示出对性能的重视。开发者在选择模型时，应考虑具体应用场景与技术需求，以做出最佳决策。

❓

Minimax M2以61分成为开源模型第一，突破智力、成本和速度的限制，编程能力和推理速度优于Claude 3.5，且成本仅为8%。

Minimax M2的定价为每百万输入Token 0.3美元，输出Token 1.2美元，成本非常低廉。

在编程能力、工具使用和深度搜索能力上，M2在国内名列前茅，且在工具使用和深度搜索方面不逊于海外顶尖模型。

M2支持Shell、浏览器、Python代码解释器和各种MCP工具的调用，表现出色。

M2是一个稀疏度较高的MoE模型，总参数量230B，激活参数量仅有10B。

M2可以用于编程、生成调研报告、制作PPT，以及开发网页和在线应用等多种场景。

🏷️