browser-harness:让 AI 直接接管你的浏览器

💡 原文中文,约4700字,阅读约需12分钟。
📝

内容提要

browser-harness 是一个开源项目,允许 AI 通过 Chrome DevTools Protocol 控制浏览器。该项目包含 daemon.py、helpers.py 和 run.py 三个主要部分,支持导航、截图和输入等基本操作。AI 还可以自动编辑 helpers.py,添加缺失的功能,适合用于 AI Agent 开发和企业系统自动化,但不适合高频率的生产环境。

🎯

关键要点

  • browser-harness 是一个开源项目,允许 AI 通过 Chrome DevTools Protocol 控制浏览器。

  • 项目包含三个主要部分:daemon.py、helpers.py 和 run.py,支持基本操作如导航、截图和输入。

  • AI 可以自动编辑 helpers.py,添加缺失的功能,适合用于 AI Agent 开发和企业系统自动化。

  • browser-harness 通过 WebSocket 连接 Chrome 的 CDP 接口,提供原始的 CDP 能力。

  • 安装需要 Python 3.10+ 和 Chrome 浏览器,并需启用远程调试。

  • 基本操作包括打开新标签页、截图、点击和输入文本,AI 可以执行 JavaScript 代码。

  • AI 可以自我修复,自动添加缺失的功能到 helpers.py,提升灵活性。

  • 项目内置 domain-skills 和 interaction-skills,帮助 AI 更高效地操作网站。

  • 与 Playwright 和 Browser Use CLI 的区别在于,browser-harness 让 AI 自己处理复杂性,而不是封装接口。

  • 适合用于 AI Agent 开发和企业内部系统自动化,但不适合高频率的生产环境。

延伸问答

browser-harness 的主要功能是什么?

browser-harness 允许 AI 通过 Chrome DevTools Protocol 控制浏览器,支持导航、截图和输入等基本操作。

如何安装 browser-harness?

安装需要 Python 3.10+ 和 Chrome 浏览器,并需启用远程调试,使用 git clone 下载后执行相关命令即可。

browser-harness 与其他自动化工具有什么区别?

与 Selenium 和 Playwright 不同,browser-harness 允许 AI 自己编写新函数和修复 bug,而不是仅调用预定义函数。

AI 如何在 browser-harness 中自我修复?

AI 可以自动编辑 helpers.py,添加缺失的功能,例如在发现没有上传文件的函数时,AI 会自己编写并添加该函数。

browser-harness 适合用于哪些场景?

适合用于 AI Agent 开发、企业内部系统自动化和浏览器任务探索,但不适合高频率的生产环境。

使用 browser-harness 进行截图的基本操作是什么?

使用 capture_screenshot() 函数可以进行截图,AI 通过截图理解页面状态并进行后续操作。

➡️

继续阅读