DEV Community ·

通过extesion实现scrapy-redis定时调度

💡 原文中文，约7300字，阅读约需18分钟。

📝

内容提要

本文介绍了一个Scrapy扩展，用于定时调度爬虫。该扩展通过Redis管理任务队列，支持使用crontab语法和间隔时间来调度爬虫，确保在空闲时自动启动任务。

🎯

❓

该扩展用于定时调度爬虫，通过Redis管理任务队列，支持crontab语法和间隔时间调度。

可以在爬虫中定义crontab语法，例如每日0点1分启动：cron_job = '1 0 * * *'。

通过Redis的去重机制，确保在短时间内不会重复启动同一个爬虫。

在扩展的初始化中，可以通过参数设置最大空闲次数，例如item_count参数。

爬虫会记录空闲状态并判断是否满足定时调度或间隔时间的条件来决定是否激活。

在爬虫启动时，通过insert_start_url方法将起始URL插入Redis队列以便后续处理。

🏷️

Dynamically Splitting Wide Partitions in Cassandra for Time Series Workloads
By Rajiv Shringi, Kaidan Fullerton, Oleksii Tkachuk and Kartik Sathyanarayana...
AI开发、3A游戏全都要！微软新旗舰实机曝光，这回彻底“MacBook化”了？
【TechWeb】微软正式揭晓了Surface系列的新巅峰之作——Surface Laptop Ultra。作为该系列首款从芯片层面与NVIDIA联合设计...
2026世界杯黑科技曝光：引入AI技术就能告别误判吗？
【TechWeb】据媒体报道，2026年美加墨世界杯将迎来一场技术革命，多项AI新技术将正式部署，旨在全面提升比赛的判罚精度与观众的观赛体验。黑科技加持：...
殊途同归还是后来居上？华为新三折叠将形态大变
【TechWeb】据数码博主“定焦数码”最新爆料，华为新一代三折叠屏手机Mate XT2非凡大师将带来颠覆性设计，彻底抛弃沿用多年的经典折叠形态，转而采用...
安卓与iPhone隔空投送正式互通！你的手机支持吗？
【TechWeb】谷歌正式宣布，Quick Share（快速分享）功能的机型阵容迎来重大扩充。新增三星、谷歌Pixel、小米、OPPO、vivo、荣耀、一...
【Rust日报】2026-06-03 内存安全关乎生死：为 Rust 成功而战
Rust Foundation Maintainers Fund 正式落地，Maintainer in Residence 项目启动 Rust 基金会宣布...