量子位 ·

编程权威榜单：千问3.7仅次于Claude，阿里全球第二

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

阿里最新旗舰模型Qwen3.7-Max在全球编程榜单Code Arena中得分1541，排名全球第二，仅次于Claude系列。该模型在代码理解与生成方面表现出色，能够独立完成复杂项目，提升办公自动化和企业生产力。开发者对其长程自主执行能力给予高度评价，认为其性能和生成质量优于其他模型。

🎯

🔎

Code Arena榜单采用开发者出题的方式，要求模型从零生成完整的Web应用程序。这种评测标准比传统的代码片段生成测试更具挑战性，能够更真实地反映模型的实际编程能力。开发者的盲测投票也增强了榜单的公信力，使得Qwen3.7-Max的高分更具说服力。

Qwen3.7-Max在编程、智能体和长程任务等领域的突破，意味着它能够在短时间内完成复杂项目，显著提升企业的办公自动化和生产力。这一能力使得它在市场上具有较强的竞争优势，尤其是在需要高效编程解决方案的行业中。

在与Claude系列和其他竞争对手的比较中，Qwen3.7-Max展现出更高的性能和生成质量。开发者普遍认为其长程自主执行能力优于同类模型，这为其在实际应用中的推广提供了良好的基础，尤其是在需要长时间运行的复杂任务中。

❓

Qwen3.7-Max在全球编程榜单Code Arena中得分1541，排名全球第二，仅次于Claude系列。

Qwen3.7-Max在代码理解与生成方面表现出色，能够独立完成复杂项目，提升办公自动化和企业生产力。

Code Arena要求模型从零生成完整的、可交互的Web应用程序，并通过用户投票综合生成榜单。

Qwen3.7-Max能够在数小时内独立完成专业团队耗时2周的复杂项目，并持续运行35小时，累计超1000次工具调用。

开发者对Qwen3.7-Max的长程自主执行能力给予高度评价，认为其性能和生成质量优于其他模型。

Qwen3.7-Max在编程、智能体、长程任务等核心能力上实现了大幅突破，成为唯一突破1540分的国产大模型。

🏷️