蓝点网 ·

稀宇科技推出MiniMax-M3模型支持1M窗口在编码和智能体任务中表现突出

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

稀宇科技推出的MiniMax-M3模型支持1M窗口，具备文本、图像和视频输入能力。基准测试显示其在编码任务上超越GPT-5.5和Gemini 3.1 Pro，接近Claude Opus 4.7。M3采用自研的稀疏注意力架构MSA，显著降低计算成本，未来将发布开源权重模型，强调长期协作和自主迭代能力。

🎯

关键要点

稀宇科技推出的MiniMax-M3模型支持1M窗口，具备文本、图像和视频输入能力。
M3模型在编码任务上超越GPT-5.5和Gemini 3.1 Pro，接近Claude Opus 4.7。
M3采用自研的稀疏注意力架构MSA，显著降低计算成本。
M3模型将在未来发布开源权重模型，强调长期协作和自主迭代能力。
MSA架构通过精准的KV分块策略和访存优化，降低计算成本至前代模型的1/20。
M3模型在编程与智能体任务的表现突出，特别是在SWE-Bench Pro基准测试中表现优异。
稀宇科技认为当前编码能力测试存在局限性，未来智能体竞争核心在于长期协作能力等。

🔎

延伸解读

新模型的多模态能力

MiniMax-M3模型的多模态输入能力使其在处理文本、图像和视频等多种数据类型时具备更高的灵活性。这种能力不仅提升了模型的应用场景，也为开发者提供了更丰富的工具，适应不同的任务需求。

稀疏注意力架构的优势

M3模型采用的稀疏注意力架构MSA显著降低了计算成本，尤其在处理长上下文时表现优异。这种架构的引入使得在百万级上下文长度下，计算量仅为前代模型的1/20，极大提高了效率，适合大规模应用。

编码能力测试的局限性

稀宇科技指出，当前的编码能力测试多基于单轮任务，未能真实反映开发过程中的复杂性。未来的智能体竞争将更注重长期协作和自主迭代能力，开发者需关注模型在实际应用中的表现和适应性。

❓

延伸问答

MiniMax-M3模型的主要特点是什么？

MiniMax-M3模型支持1M窗口，具备文本、图像和视频输入能力，采用自研的稀疏注意力架构MSA，显著降低计算成本。

MiniMax-M3在编码任务中的表现如何？

MiniMax-M3在编码任务上超越了GPT-5.5和Gemini 3.1 Pro，接近Claude Opus 4.7。

MSA架构如何降低计算成本？

MSA架构通过精准的KV分块策略和访存优化，将计算成本降低至前代模型的1/20。

未来稀宇科技对MiniMax-M3模型有什么计划？

稀宇科技计划在未来发布M3模型的开源权重模型，并强调长期协作和自主迭代能力。

MiniMax-M3模型在智能体任务中的表现如何？

M3模型在智能体任务中表现突出，特别是在SWE-Bench Pro基准测试中取得了59.0%的成绩。

稀宇科技对当前编码能力测试的看法是什么？

稀宇科技认为当前编码能力测试存在局限性，强调未来智能体竞争核心在于长期协作能力等。

🏷️