爱范儿 ·

深夜重磅！全球首个混合推理模型发布，Claude 能「思考」了，实测发现这些细节

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

Claude 3.7 Sonnet正式发布，作为最智能的AI模型，具备快速响应和深入推理两种模式。新工具Claude Code高效处理编程任务，缩短开发时间，支持多种开发流程，优化安全性和用户体验。

🎯

关键要点

Claude 3.7 Sonnet 正式发布，作为最智能的 AI 模型，具备快速响应和深入推理两种模式。
新工具 Claude Code 高效处理编程任务，缩短开发时间，支持多种开发流程。
Claude 3.7 Sonnet 采用混合推理方式，用户可选择快速作答或深度思考。
在扩展思考模式下，Claude 3.7 Sonnet 在复杂任务上表现卓越，特别是在数学和编程领域。
Claude 3.7 Sonnet 在基准测试中表现出色，适用于真实软件问题解决。
Claude 3.7 Sonnet 可通过多种平台访问，支持扩展思考模式，定价与前代模型一致。
Claude Code 能够直接在终端处理代码，显著减少开发时间，特别是在测试驱动开发和复杂调试方面。
Claude Code 集成到开发环境中，简化工作流程，支持多种核心开发功能。
Anthropic 计划持续优化 Claude Code，提升工具调用稳定性和用户体验。
Claude 3.7 Sonnet 的思考过程设计为客观，未进行标准角色训练，未来可能根据用户反馈调整公开思考过程的策略。
AI 模型命名问题成为行业共识，Anthropic 也在寻找更清晰的命名方式。

🔎

延伸解读

混合推理模型的优势

Claude 3.7 Sonnet 采用混合推理方式，用户可以根据需求选择快速响应或深入思考。这种灵活性使其在处理复杂任务时表现更佳，尤其是在数学和编程领域，能够更好地满足不同用户的需求。

Claude Code 的实用性

新推出的 Claude Code 工具显著提高了编程效率，能够直接在终端处理复杂代码任务，尤其适合测试驱动开发和调试。开发者可以通过自然语言命令与其互动，简化工作流程，提升协作效率。

思考过程的透明性

Claude 3.7 Sonnet 的思考过程设计为客观，未进行标准角色训练。这种透明性虽然有助于用户理解模型的推理逻辑，但也可能导致思考结果不够个性化，未来可能会根据用户反馈进行调整。

行业命名挑战

随着 AI 模型的快速迭代，命名问题成为行业共识。Anthropic 也在探索更清晰的命名方式，以适应不断变化的技术环境。这反映了整个行业在快速发展中面临的挑战，亟需统一标准。

❓

延伸问答

Claude 3.7 Sonnet 有哪些主要功能？

Claude 3.7 Sonnet 具备快速响应和深入推理两种模式，能够处理复杂任务，特别是在数学和编程领域表现卓越。

Claude Code 是什么，它能做什么？

Claude Code 是一款智能编程工具，能够直接在终端处理代码，支持代码编辑、测试执行等核心开发流程，显著减少开发时间。

Claude 3.7 Sonnet 的定价如何？

Claude 3.7 Sonnet 的定价与前代模型一致，输入 100 万个 token 收费 3 美元，输出 100 万个 token 收费 15 美元。

Claude 3.7 Sonnet 在基准测试中的表现如何？

Claude 3.7 Sonnet 在 SWE-bench Verified 基准测试中表现出色，适用于真实软件问题解决，展现了优异的推理和数学能力。

Claude 3.7 Sonnet 的思考过程有什么特点？

Claude 3.7 Sonnet 的思考过程设计为客观，未进行标准角色训练，未来可能根据用户反馈调整公开思考过程的策略。

Claude Code 如何提高开发效率？

Claude Code 能够一次性完成通常需要 45 分钟以上的人工任务，特别在测试驱动开发和复杂调试方面表现突出，极大地简化了工作流程。

🏷️