dotNET跨平台 ·

使用browser-use进行数据爬取实战记录

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

本文介绍了使用browser-use进行数据爬取的实战，包括使用个人浏览器、定义输出结构和注册行为。通过示例代码，展示了如何获取账单信息并保存结果，强调了个人浏览器的便利性。

🎯

🔎

使用自己的浏览器进行数据爬取可以避免重复登录，提升效率。特别是对于需要频繁访问的账户信息，使用已保存的登录状态可以节省时间，减少操作步骤。

定义自定义输出结构可以帮助用户更好地处理和分析爬取的数据。通过明确数据格式，用户能够更方便地进行后续的数据处理和存储，提升数据利用率。

注册行为功能允许用户将爬取结果直接保存到指定文件中，增强了数据管理的灵活性。这对于需要长期保存和分析数据的用户尤为重要，可以有效组织和归档信息。

❓

使用自己的浏览器可以直接登录保存信息的网站，避免重复验证。代码中需要指定浏览器的路径。

可以通过创建一个继承自BaseModel的类来定义自定义输出结构，以便更好地处理爬取的数据。

可以注册一个行为，将结果保存到指定文件中，使用代码中的save_to_file函数实现。

主要步骤包括使用自己的浏览器、定义输出结构和注册行为来保存结果。

使用browser-use可以方便地登录保存信息的网站，减少重复验证的麻烦，并且可以自定义数据处理方式。

示例代码通过Agent类的run方法获取指定网址的账单信息，并打印结果。

🏷️