💡
原文中文,约1800字,阅读约需5分钟。
📝
内容提要
Mistral AI发布了新一代Mistral 3系列模型,旨在与中国模型竞争。尽管Mistral Large 3在某些测试中表现尚可,但整体性能和价格不及DeepSeek,面临挑战。小模型Ministral性价比高,支持图像理解。Mistral需要进一步提升以满足市场需求。
🎯
关键要点
- Mistral AI发布了新一代Mistral 3系列模型,旨在与中国模型竞争。
- Mistral Large 3是旗舰模型,参数量为675B,活跃参数为41B。
- Mistral的对比策略主要针对中国的DeepSeek-V3.1和Kimi-K2。
- 在MMMLU和AMC测试中,Mistral Large 3略微领先DeepSeek-V3.1,但在LiveCodeBench和SimpleQA上输给Kimi-K2。
- Mistral Large 3被批评为更笨、更贵且推理速度慢,得分仅为38分。
- 在开源非推理模型中,Mistral Large 3排名第二,总榜第六,表现尚可但不突出。
- Ministral 3被认为是性价比最高的开源模型,支持图像理解。
- Mistral 3的推理版在AIME’25测试中准确率达85%。
- Mistral需要进一步提升以满足市场需求,当前处于尴尬的中间位置。
❓
延伸问答
Mistral 3系列模型的主要目标是什么?
Mistral 3系列模型旨在与中国的AI模型竞争。
Mistral Large 3的参数量是多少?
Mistral Large 3的总参数量为675B,活跃参数为41B。
Mistral Large 3在测试中表现如何?
Mistral Large 3在MMMLU和AMC测试中略微领先DeepSeek-V3.1,但在LiveCodeBench和SimpleQA上输给Kimi-K2。
Ministral 3模型的优势是什么?
Ministral 3被认为是性价比最高的开源模型,支持图像理解。
Mistral Large 3的价格与DeepSeek相比如何?
Mistral Large 3的价格是DeepSeek的3倍。
Mistral 3在市场上面临哪些挑战?
Mistral需要进一步提升以满足市场需求,目前处于尴尬的中间位置。
➡️