推荐一个.Net Core开发的蜘蛛爬虫开源项目

💡 原文中文,约2900字,阅读约需7分钟。
📝

内容提要

Scrapy.NetCore是一个基于.NetCore开发的开源项目,支持Windows、Mono、Liunx、Windows Azure、Docker,可以帮助快速完成爬取任务,支持网页Http数据爬取、解析网页数据、存储解析的数据至数据库、采集去重、分部署部署、下载代理器注册服务、统计、请求配置、数据流、并发等功能。欢迎加入.Net编程学习小圈子,获取海量的编程学习资源、学习路线,和大家一起打卡、分享编程知识、共同进步。

🎯

关键要点

  • Scrapy.NetCore是一个基于.NetCore开发的开源项目,支持多种平台。

  • 该项目可以帮助快速完成网页数据的爬取、解析和存储。

  • 技术架构支持Windows、Mono、Linux、Windows Azure和Docker。

  • 框架功能包括网页Http数据爬取、数据解析、去重、调度、并发等。

  • 支持多种数据库和组件,如MySql和RabbitMQ。

  • 项目结构中包含简单爬虫的使用例子和Html数据解析示例。

  • 项目地址为https://github.com/dotnetcore/DotnetSpider。

  • 欢迎加入.Net编程学习小圈子,获取编程学习资源和分享知识。

➡️

继续阅读