InfoQ ·

Anthropic发布新款Claude模型及计算机使用功能

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

Anthropic发布了Claude 3.5 Haiku和改进版Claude 3.5 Sonnet，后者能够像人类一样与计算机GUI互动。Claude 3.5 Haiku是最快的模型，性能优于GPT-4o等。新功能依赖于图像解析，尽管目前速度较慢且易出错，但具有自动化多种业务流程的潜力。

🎯

关键要点

Anthropic发布了Claude 3.5 Haiku和改进版Claude 3.5 Sonnet，后者能够像人类一样与计算机GUI互动。
Claude 3.5 Haiku是最快的模型，性能优于GPT-4o等。
Claude 3.5 Sonnet的新功能允许模型通过解析图像与计算机互动，支持鼠标移动、点击按钮和输入文本。
Claude的计算机使用功能标志着AI开发的新方法，旨在让模型适应日常计算机环境。
Claude在OSWorld基准测试中表现出色，但目前得分仍低于人类用户。
Hacker News用户讨论了计算机使用功能的潜力，认为它可以自动化多种业务流程。
尽管功能强大，但Anthropic承认该功能仍然较慢且易出错。
Claude的计算机使用功能目前处于公开测试阶段，并在GitHub上发布了示例代码。

❓

延伸问答

Claude 3.5 Haiku和Claude 3.5 Sonnet有什么区别？

Claude 3.5 Haiku是最快的模型，而Claude 3.5 Sonnet则具备与计算机GUI互动的功能。

Claude 3.5 Sonnet的计算机使用功能是如何工作的？

该功能通过解析屏幕图像，允许模型移动鼠标、点击按钮和输入文本。

Claude在OSWorld基准测试中的表现如何？

Claude在OSWorld基准测试中得分为14.9%，低于人类用户的70%以上，但高于GPT-4的7.7%。

Anthropic对Claude的计算机使用功能有何看法？

Anthropic承认该功能仍然较慢且易出错，但认为这是AI开发的新方法。

Claude的计算机使用功能有哪些潜在应用？

该功能可以自动化多种业务流程，适用于与人类用户直接交互的软件。

Claude的计算机使用功能目前处于什么阶段？

该功能目前处于公开测试阶段，并在GitHub上发布了示例代码。

🏷️

标签

Anthropic Claude 3.5 claude 图像解析自动化计算机计算机GUI

➡️

继续阅读

为什么仅靠更便宜的模型无法节省你的人工智能预算
随着智能代理的发展，工程师面临代币消耗过高的问题。复杂任务可能消耗数十万代币。为降低成本，团队探索了三种策略：压缩上下文、将任务分配给更便宜的模型，以及使...
[送码] 聆听用户建议，1Capture 新增多项实用截图功能
1Capture是一款专为开发团队设计的Mac截图与录屏工具，经过多次更新，新增动态荧光笔、多彩马赛克、AI擦除、点击动画和GIF录制等功能，以提升截图和...
光象科技累计完成数亿元天使轮融资，布局物理原生基座模型
光象科技近日完成数亿元天使轮融资，资金将用于物理原生基座模型研发及具身智能机器人商业化。公司推出的Phi-Bot X1机器人在汽车产线焊接中表现出色，验证...
早报｜大疆影石专利战火烧回国内/阿里内部全面禁用Claude Code/茉莉奶白被判赔LV 1030万后，月薪4万招法务
大疆与影石在国内展开专利侵权诉讼，互相指控侵犯核心专利。大疆指控影石的Luna系列侵犯其手持云台专利，影石则反诉大疆的全景相机产品。此诉讼发生在双方美国案...
一分钟读论文：《多模型组合的共失败天花板》
研究揭示了多模型组合的共失败率天花板beta，表明传统的错误相关性指标rho无法准确反映模型间的依赖关系。实测数据显示，不同任务的共失败率存在显著差异，增...
更好的模型：更差的工具
最近的Claude模型在调用Pi的编辑工具时出现了额外的虚构字段，导致工具调用失败。尽管编辑内容正确，但参数格式不符合预期。新模型在这方面的表现不如旧模型...