极道 ·

Browser Harness是一种浏览器操控工具：让大模型自主完成任务！

💡 原文中文，约6500字，阅读约需16分钟。

📝

内容提要

Browser Harness是一种自愈式浏览器操控工具，允许大语言模型自主完成任务。它通过CDP协议与Chrome直接连接，去除了传统框架的限制。该工具设计简洁，代码量仅592行，支持云端浏览器服务，能自动处理错误并自我修复，展现出强大的自动化能力。

🎯

🔎

Browser Harness的自我修复机制使得大语言模型在遇到缺失函数时能够自动生成代码，避免了传统框架的崩溃。这种设计不仅提升了工具的灵活性，还使得模型在使用过程中不断进化，逐渐适应用户的需求。用户无需干预，模型能够自主解决问题，提升了整体效率。

与Selenium等传统框架相比，Browser Harness采取了极简设计，去除了预设函数的限制。这种方式让大语言模型能够根据实时需求编写代码，避免了传统框架在功能更新上的滞后。这种灵活性使得Browser Harness在处理动态网页和复杂交互时表现更为出色。

Browser Harness支持云端浏览器服务，用户可以在本地和云端同时运行多个浏览器实例。这对于需要同时处理多个任务或在不同网络环境下工作的用户尤为重要。云端服务的灵活性和高效性使得用户能够更好地利用资源，提升工作效率。

❓

Browser Harness是一种自愈式浏览器操控工具，允许大语言模型自主完成任务。

它通过CDP协议与Chrome直接连接，去除了传统框架的限制。

当遇到缺失函数时，它会捕获错误信息并让大语言模型自动生成缺失的代码。

用户需要克隆仓库、启动Chrome浏览器的远程调试模式，并配置调试端口。

它不预设函数，允许大语言模型根据需求现场编写代码，提升了灵活性和适应性。

用户可以申请API密钥，在云端启动浏览器实例，支持多个并发浏览器运行。

🏷️