谷歌推出AI代理项目Mariner 可以理解并推理浏览器屏幕上的信息帮助完成任务处理
💡
原文中文,约900字,阅读约需3分钟。
📝
内容提要
谷歌推出的AI代理项目Project Mariner,基于Gemini 2.0模型,能够理解浏览器信息并自动执行任务。目前仅在活动选项卡中操作,支持数据整理和填充,未来将扩大测试范围。
🎯
关键要点
- 谷歌推出的AI代理项目Project Mariner基于Gemini 2.0模型。
- 该项目能够理解浏览器屏幕上的信息并自动执行任务。
- 目前仅在活动选项卡中进行操作,支持键入、滚动和点击。
- AI代理可以理解像素点、文本、代码、图像和表单等数据。
- 用户可以通过指令让AI代理自动与浏览器交互,完成数据整理和填充。
- Project Mariner在WebVoyager基准测试中实现了83.5%的最佳工作结果。
- 目前仅向值得信赖的开发者提供测试,未来将扩大测试范围。
❓
延伸问答
Project Mariner的主要功能是什么?
Project Mariner能够理解浏览器屏幕上的信息并自动执行任务,如数据整理和填充。
Project Mariner是基于什么模型开发的?
Project Mariner是基于谷歌的Gemini 2.0模型开发的。
目前Project Mariner的测试范围如何?
目前仅向值得信赖的开发者提供测试,未来将扩大测试范围。
Project Mariner如何与浏览器交互?
Project Mariner可以在活动选项卡中进行键入、滚动和点击操作。
Project Mariner在WebVoyager基准测试中的表现如何?
在WebVoyager基准测试中,Project Mariner实现了83.5%的最佳工作结果。
用户如何指令Project Mariner完成任务?
用户可以通过指令让AI代理自动与浏览器交互,完成指定的任务。
🏷️
标签
➡️