Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
💡
原文中文,约1500字,阅读约需4分钟。
📝
内容提要
Qwen3“超大杯”推理版在AIME 25测试中获得满分,超越GPT-5系列。尽管仍在训练中,Qwen3-Max-Thinking已可免费试用,技术细节尚未公布。该模型在物理和数学题上表现良好,但仍需优化,用户期待开源。
🎯
关键要点
- Qwen3“超大杯”推理版在AIME 25测试中获得满分,超越GPT-5系列。
- Qwen3-Max-Thinking仍在训练中,但已可免费试用,技术细节尚未公布。
- Qwen3-Max-Thinking在物理和数学题上表现良好,但仍需优化。
- 用户期待Qwen3-Max-Thinking的开源版本。
- 模型在经典题和IMO竞赛题上均表现出色,但在某些方面仍需改进。
- Qwen技术负责人表示,模型的全面性仍需时间来完善。
➡️