稀宇科技推出MiniMax-M3模型 支持1M窗口在编码和智能体任务中表现突出

💡 原文中文,约1400字,阅读约需4分钟。
📝

内容提要

稀宇科技推出的MiniMax-M3模型支持1M窗口,具备文本、图像和视频输入能力。基准测试显示其在编码任务上超越GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7。M3采用自研的稀疏注意力架构MSA,显著降低计算成本,未来将发布开源权重模型,强调长期协作和自主迭代能力。

🎯

关键要点

  • 稀宇科技推出的MiniMax-M3模型支持1M窗口,具备文本、图像和视频输入能力。

  • M3模型在编码任务上超越GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7。

  • M3采用自研的稀疏注意力架构MSA,显著降低计算成本。

  • M3模型将在未来发布开源权重模型,强调长期协作和自主迭代能力。

  • MSA架构通过精准的KV分块策略和访存优化,降低计算成本至前代模型的1/20。

  • M3模型在编程与智能体任务的表现突出,特别是在SWE-Bench Pro基准测试中表现优异。

  • 稀宇科技认为当前编码能力测试存在局限性,未来智能体竞争核心在于长期协作能力等。

延伸问答

MiniMax-M3模型的主要特点是什么?

MiniMax-M3模型支持1M窗口,具备文本、图像和视频输入能力,采用自研的稀疏注意力架构MSA,显著降低计算成本。

MiniMax-M3在编码任务中的表现如何?

MiniMax-M3在编码任务上超越了GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7。

MSA架构如何降低计算成本?

MSA架构通过精准的KV分块策略和访存优化,将计算成本降低至前代模型的1/20。

未来稀宇科技对MiniMax-M3模型有什么计划?

稀宇科技计划在未来发布M3模型的开源权重模型,并强调长期协作和自主迭代能力。

MiniMax-M3模型在智能体任务中的表现如何?

M3模型在智能体任务中表现突出,特别是在SWE-Bench Pro基准测试中取得了59.0%的成绩。

稀宇科技对当前编码能力测试的看法是什么?

稀宇科技认为当前编码能力测试存在局限性,强调未来智能体竞争核心在于长期协作能力等。

➡️

继续阅读