Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
💡
原文中文,约1500字,阅读约需4分钟。
📝
内容提要
Qwen3“超大杯”推理版在AIME 25测试中获得满分,超越GPT-5系列。尽管仍在训练中,Qwen3-Max-Thinking已可免费试用,技术细节尚未公布。该模型在物理和数学题上表现良好,但仍需优化,用户期待开源。
🎯
关键要点
- Qwen3“超大杯”推理版在AIME 25测试中获得满分,超越GPT-5系列。
- Qwen3-Max-Thinking仍在训练中,但已可免费试用,技术细节尚未公布。
- Qwen3-Max-Thinking在物理和数学题上表现良好,但仍需优化。
- 用户期待Qwen3-Max-Thinking的开源版本。
- 模型在经典题和IMO竞赛题上均表现出色,但在某些方面仍需改进。
- Qwen技术负责人表示,模型的全面性仍需时间来完善。
❓
延伸问答
Qwen3-Max-Thinking在AIME 25测试中的表现如何?
Qwen3-Max-Thinking在AIME 25测试中获得满分,表现超越了GPT-5系列。
Qwen3-Max-Thinking目前的状态是什么?
Qwen3-Max-Thinking仍在训练中,但已可免费试用,技术细节尚未公布。
用户对Qwen3-Max-Thinking的期待是什么?
用户期待Qwen3-Max-Thinking的开源版本。
Qwen3-Max-Thinking在数学题上的表现如何?
Qwen3-Max-Thinking在物理和数学题上表现良好,但仍需优化。
Qwen3-Max-Thinking的思考时间是怎样的?
在Thinking模式下,Qwen3-Max-Thinking的思考时间较长,有时会出现中英文各想一遍的情况。
Qwen3-Max-Thinking的技术细节是否公开?
目前Qwen官方尚未透露Qwen3-Max-Thinking的更多技术细节。
➡️