小红花·文摘 - 小红花技术领袖俱乐部

科技爱好者周刊（第 343 期）：如何阻止 AI 爬虫

科技爱好者周刊（第 343 期）：如何阻止 AI 爬虫

阮一峰的网络日志 ·

开源软件基础设施正受到AI爬虫攻击，GNOME网站在2.5小时内接到81,000个请求，其中97%为爬虫。爬虫不遵守robots.txt协议，导致服务器压力增加。GNOME等项目不得不使用Anubi系统拦截爬虫，管理员耗费大量资源应对这一问题。

开源/自有软件基础设施正在被人工智能破坏大约97%的请求/流量都是爬虫而非真人

蓝点网 ·

如何判断一个网站是否允许抓取

如何判断一个网站是否允许抓取

DEV Community ·

该项目收集了各大公司的AI爬虫名称，建议网站管理员屏蔽这些爬虫以保护网站内容，减少服务器压力，且不影响网站正常运行。尽管允许爬虫抓取有助于AI发展，但大多数大型出版商选择不允许。

[开源项目] 收集各种AI爬虫名称并将其屏蔽避免AI抓取你的数据训练模型

蓝点网 ·