量子位 ·

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

Mistral AI推出了新推理模型Magistral，支持多语言推理。该模型采用纯强化学习训练，提升了准确率，实现高效实时推理，但未与Qwen和DeepSeek R1进行对比，引发质疑。

🎯

🔎

Magistral模型的多语言推理能力是其一大亮点，尤其在处理欧洲语言时表现优于其他主流模型。这一特性不仅提升了用户体验，也为全球用户提供了更为精准的服务，尤其是在多语言环境中。

Mistral AI未能在发布时提供与Qwen和DeepSeek R1的直接对比，导致外界对其性能产生质疑。尽管Magistral在某些基准测试中表现出色，但缺乏与最新竞争对手的比较可能影响其市场接受度。

Magistral采用纯强化学习训练，结合改进的Group Relative Policy Optimization算法，展现出新的训练范式。这种方法不仅提高了模型的准确率，也为未来的推理模型开发提供了新的思路，值得关注其长期影响。

❓

Magistral模型支持多语言推理，采用纯强化学习训练，提升了准确率，并实现高效实时推理。

Magistral发布时未与Qwen和DeepSeek R1进行对比，网友对此表示质疑，认为Qwen和R1表现更佳。

Magistral发布了两种版本：Magistral Small和Magistral Medium，分别适用于开源和企业用户。

Magistral针对多步逻辑进行了微调，提升了可解释性，并提供可追溯的思考过程。

Magistral采用改进的Group Relative Policy Optimization算法，通过纯强化学习进行训练。

Mistral AI被批评为越来越不开放，建议其争取真正的开源以占据领导地位。

🏷️