维基百科附属的维基媒体被AI爬虫轰炸 超过65%的昂贵网络流量由AI爬虫消耗
💡
原文中文,约1100字,阅读约需3分钟。
📝
内容提要
维基媒体面临AI爬虫的严重影响,65%的带宽被爬虫占用,导致整体流量增长50%。这些爬虫大量抓取媒体文件用于AI训练,影响正常用户访问。维基媒体需采取措施保护基础设施和资源。
🎯
关键要点
- 维基媒体面临AI爬虫的严重影响,65%的带宽被爬虫占用。
- 整体流量增长50%,主要由爬虫造成,影响正常用户访问。
- 维基媒体托管着1.44亿张媒体文件,这些文件被AI公司用于训练模型。
- 自2024年1月以来,下载多媒体内容的带宽增长50%,非人类访问导致流量激增。
- 维基媒体的基础设施设计用于应对人类流量的激增,但爬虫流量前所未有,带来风险和成本。
- 爬虫请求中65%来自机器人,导致人类用户的访问比例仅为35%。
- 维基媒体需采取措施保护基础设施,避免AI爬虫消耗资源。
➡️