Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

💡 原文中文,约1500字,阅读约需4分钟。
📝

内容提要

Qwen3“超大杯”推理版在AIME 25测试中获得满分,超越GPT-5系列。尽管仍在训练中,Qwen3-Max-Thinking已可免费试用,技术细节尚未公布。该模型在物理和数学题上表现良好,但仍需优化,用户期待开源。

🎯

关键要点

  • Qwen3“超大杯”推理版在AIME 25测试中获得满分,超越GPT-5系列。
  • Qwen3-Max-Thinking仍在训练中,但已可免费试用,技术细节尚未公布。
  • Qwen3-Max-Thinking在物理和数学题上表现良好,但仍需优化。
  • 用户期待Qwen3-Max-Thinking的开源版本。
  • 模型在经典题和IMO竞赛题上均表现出色,但在某些方面仍需改进。
  • Qwen技术负责人表示,模型的全面性仍需时间来完善。

延伸问答

Qwen3-Max-Thinking在AIME 25测试中的表现如何?

Qwen3-Max-Thinking在AIME 25测试中获得满分,表现超越了GPT-5系列。

Qwen3-Max-Thinking目前的状态是什么?

Qwen3-Max-Thinking仍在训练中,但已可免费试用,技术细节尚未公布。

用户对Qwen3-Max-Thinking的期待是什么?

用户期待Qwen3-Max-Thinking的开源版本。

Qwen3-Max-Thinking在数学题上的表现如何?

Qwen3-Max-Thinking在物理和数学题上表现良好,但仍需优化。

Qwen3-Max-Thinking的思考时间是怎样的?

在Thinking模式下,Qwen3-Max-Thinking的思考时间较长,有时会出现中英文各想一遍的情况。

Qwen3-Max-Thinking的技术细节是否公开?

目前Qwen官方尚未透露Qwen3-Max-Thinking的更多技术细节。

➡️

继续阅读