蓝点网 ·

Reddit论坛将阻止互联网档案馆抓取页面因为AI公司从互联网档案馆抓取数据

💡 原文中文，约900字，阅读约需3分钟。

📝

内容提要

Reddit 宣布禁止互联网档案馆抓取其内容，因 AI 公司通过该网站抓取数据违反使用条款。Reddit 要求 AI 公司签署商业协议并支付费用才能抓取数据。互联网档案馆目前只能有限抓取首页内容，双方正在沟通。

🎯

🔎

Reddit要求AI公司签署商业协议并支付费用才能抓取其数据，这反映了其对数据价值的重视。与谷歌的合作表明，Reddit愿意与大公司建立经济关系，但对未经授权的抓取行为则采取强硬立场。这种策略可能会影响其他平台的抓取政策，促使更多网站考虑如何保护自己的数据资源。

由于Reddit的限制，互联网档案馆只能有限抓取Reddit的首页内容，这将影响其用户访问历史数据的能力。用户可能无法再查看完整的帖子和评论，这对研究和信息检索造成了障碍。互联网档案馆需要与Reddit进行有效沟通，以寻求解决方案，确保其服务的完整性。

Reddit对AI公司抓取行为的法律反应，尤其是对Anthropic的起诉，表明了内容创作者对数据使用的敏感性。AI公司在抓取数据时需谨慎，避免侵犯使用条款，可能面临法律诉讼和经济赔偿的风险。这一事件提醒行业内的其他公司，遵循法律和道德规范是至关重要的。

❓

因为AI公司通过互联网档案馆抓取Reddit的数据，违反了Reddit的使用条款。

互联网档案馆只能有限抓取Reddit首页内容，无法抓取帖子详情、评论和个人资料。

Reddit要求AI公司签署商业协议并支付费用才能抓取数据。

互联网档案馆正在与Reddit积极沟通，试图解决抓取问题。

Reddit对AI公司抓取数据持反对态度，认为这违反了使用条款。

Reddit起诉了Claude开发商Anthropic，指控其未经授权抓取内容。

🏷️