阿里云开源的 Page Agent 是一款基于 JavaScript 的 GUI 智能体,支持用户通过自然语言控制网页,适合 SaaS 产品集成和个人自动化任务。其优点包括轻量、低成本和易用,但在 DOM 依赖性和复杂任务处理上存在局限。整体值得关注。
page-agent 是一个纯 JS 实现的 GUI 代理,允许用户通过自然语言与网页应用互动。网站所有者只需引用 JS 代码,访客即可使用聊天框功能。个人用户可通过浏览器扩展进行简单自动化,但在识别页面元素时可能会遇到问题。
完成下面两步后,将自动完成登录并继续当前操作。