量子位 ·

Qwen拿半成品刷下AIME’25满分，给别人留点面子吧……

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

Qwen3“超大杯”推理版在AIME 25测试中获得满分，超越GPT-5系列。尽管仍在训练中，Qwen3-Max-Thinking已可免费试用，技术细节尚未公布。该模型在物理和数学题上表现良好，但仍需优化，用户期待开源。

🎯

🔎

尽管Qwen3-Max-Thinking在AIME 25测试中表现出色，但仍处于训练阶段，技术细节尚未完全公开。这意味着模型的能力可能会随着后续更新而提升，但目前的表现也显示出其在某些复杂问题上的思考时间较长，可能影响用户体验。

用户对Qwen3-Max-Thinking的开源版本充满期待，这反映了社区对模型进一步发展的关注。开源不仅能促进技术的透明度，还能吸引更多开发者参与改进，推动模型的全面性和实用性提升。

Qwen3在AIME 25测试中超越了GPT-5系列，显示出其在数学推理方面的优势。然而，GPT-5系列在其他领域的表现仍然值得关注，用户在选择模型时应考虑具体应用场景和需求。

❓

Qwen3-Max-Thinking在AIME 25测试中获得满分，表现超越了GPT-5系列。

Qwen3-Max-Thinking仍在训练中，但已可免费试用，技术细节尚未公布。

用户期待Qwen3-Max-Thinking的开源版本。

Qwen3-Max-Thinking在物理和数学题上表现良好，但仍需优化。

在Thinking模式下，Qwen3-Max-Thinking的思考时间较长，有时会出现中英文各想一遍的情况。

目前Qwen官方尚未透露Qwen3-Max-Thinking的更多技术细节。

🏷️