推荐一个.Net Core开发的蜘蛛爬虫开源项目
💡
原文中文,约2900字,阅读约需7分钟。
📝
内容提要
Scrapy.NetCore是一个基于.NetCore开发的开源项目,支持Windows、Mono、Liunx、Windows Azure、Docker,可以帮助快速完成爬取任务,支持网页Http数据爬取、解析网页数据、存储解析的数据至数据库、采集去重、分部署部署、下载代理器注册服务、统计、请求配置、数据流、并发等功能。欢迎加入.Net编程学习小圈子,获取海量的编程学习资源、学习路线,和大家一起打卡、分享编程知识、共同进步。
🎯
关键要点
-
Scrapy.NetCore是一个基于.NetCore开发的开源项目,支持多种平台。
-
该项目可以帮助快速完成网页数据的爬取、解析和存储。
-
技术架构支持Windows、Mono、Linux、Windows Azure和Docker。
-
框架功能包括网页Http数据爬取、数据解析、去重、调度、并发等。
-
支持多种数据库和组件,如MySql和RabbitMQ。
-
项目结构中包含简单爬虫的使用例子和Html数据解析示例。
-
项目地址为https://github.com/dotnetcore/DotnetSpider。
-
欢迎加入.Net编程学习小圈子,获取编程学习资源和分享知识。
➡️