browser-harness:让 AI 直接接管你的浏览器
内容提要
browser-harness 是一个开源项目,允许 AI 通过 Chrome DevTools Protocol 控制浏览器。该项目包含 daemon.py、helpers.py 和 run.py 三个主要部分,支持导航、截图和输入等基本操作。AI 还可以自动编辑 helpers.py,添加缺失的功能,适合用于 AI Agent 开发和企业系统自动化,但不适合高频率的生产环境。
关键要点
-
browser-harness 是一个开源项目,允许 AI 通过 Chrome DevTools Protocol 控制浏览器。
-
项目包含三个主要部分:daemon.py、helpers.py 和 run.py,支持基本操作如导航、截图和输入。
-
AI 可以自动编辑 helpers.py,添加缺失的功能,适合用于 AI Agent 开发和企业系统自动化。
-
browser-harness 通过 WebSocket 连接 Chrome 的 CDP 接口,提供原始的 CDP 能力。
-
安装需要 Python 3.10+ 和 Chrome 浏览器,并需启用远程调试。
-
基本操作包括打开新标签页、截图、点击和输入文本,AI 可以执行 JavaScript 代码。
-
AI 可以自我修复,自动添加缺失的功能到 helpers.py,提升灵活性。
-
项目内置 domain-skills 和 interaction-skills,帮助 AI 更高效地操作网站。
-
与 Playwright 和 Browser Use CLI 的区别在于,browser-harness 让 AI 自己处理复杂性,而不是封装接口。
-
适合用于 AI Agent 开发和企业内部系统自动化,但不适合高频率的生产环境。
延伸问答
browser-harness 的主要功能是什么?
browser-harness 允许 AI 通过 Chrome DevTools Protocol 控制浏览器,支持导航、截图和输入等基本操作。
如何安装 browser-harness?
安装需要 Python 3.10+ 和 Chrome 浏览器,并需启用远程调试,使用 git clone 下载后执行相关命令即可。
browser-harness 与其他自动化工具有什么区别?
与 Selenium 和 Playwright 不同,browser-harness 允许 AI 自己编写新函数和修复 bug,而不是仅调用预定义函数。
AI 如何在 browser-harness 中自我修复?
AI 可以自动编辑 helpers.py,添加缺失的功能,例如在发现没有上传文件的函数时,AI 会自己编写并添加该函数。
browser-harness 适合用于哪些场景?
适合用于 AI Agent 开发、企业内部系统自动化和浏览器任务探索,但不适合高频率的生产环境。
使用 browser-harness 进行截图的基本操作是什么?
使用 capture_screenshot() 函数可以进行截图,AI 通过截图理解页面状态并进行后续操作。