量子位 ·

Claude Opus 4.5发布！2小时工程测试超人类，前代Sonnet搞不定的活它轻松拿捏

💡 原文中文，约2500字，阅读约需6分钟。

📝

内容提要

Claude Opus 4.5发布，编码与计算能力显著提升，能独立处理复杂任务，超越前代Sonnet。在工程任务测试中得分超过所有人类，展现出强大的理解力和解决问题的能力。开发者平台及应用升级，支持更高效的任务处理与多智能体系统管理。

🎯

🔎

Claude Opus 4.5在工程任务测试中超越所有人类候选人，显示出其在技术能力和时间压力下的优越表现。这一结果可能会引发工程行业对AI应用的重新思考，尤其是在高强度任务中的潜在替代性。

Opus 4.5支持高效管理多个子智能体，能够构建复杂的多智能体系统。这一功能的提升意味着在处理复杂任务时，用户可以更灵活地调配资源，提升整体工作效率。

Claude Opus 4.5在抵御提示词注入攻击方面的安全防护能力得到了显著增强。这对于开发者和企业用户来说，意味着在使用AI时可以更安心，降低了潜在的安全风险。

❓

Claude Opus 4.5主要功能包括编码能力提升、复杂任务处理、视觉能力增强以及自主决策能力。

在工程任务测试中，Claude Opus 4.5的得分超过所有人类候选人，展现出强大的理解力和解决问题的能力。

Claude Opus 4.5能够自主处理模糊场景和复杂决策，无需人工引导，能够独立定位并提供修复方案。

Claude Opus 4.5的安全防护能力升级，特别是在抵御提示词注入攻击方面有显著增强。

Claude API新增了“努力度参数”，支持开发者根据需求选择性能表现，优化时间和成本。

在多语言测试中，Claude Opus 4.5在8种编程语言中有7种表现位列榜首，显示出其卓越的编码能力。

🏷️