Meta 承认使用盗版书籍来训练 AI,并拒绝赔偿作家

💡 原文中文,约900字,阅读约需2分钟。
📝

内容提要

科技巨头Meta因使用包含大量盗版书籍的数据集训练语言模型而面临集体诉讼。Meta承认使用了Books3数据集,但拒绝向作者支付补偿。OpenAI和微软也因使用受版权保护的材料训练AI模型而被诉。

🎯

关键要点

  • Meta因使用包含大量盗版书籍的Books3数据集训练语言模型而面临集体诉讼。
  • Meta承认使用Books3数据集,但拒绝向作者支付补偿。
  • Books3数据集包含19.5万本图书,容量近37GB,由AI研究者Shawn Presser于2020年创建。
  • Books3中包含大量从盗版网站Bibliotik爬取的受版权保护作品,导致Meta面临法律风险。
  • OpenAI和微软也因使用受版权保护的材料训练AI模型而被诉。
  • OpenAI辩称不使用受版权保护的材料训练AI模型几乎不可能,并要求法院驳回诉讼。
  • Meta声称其使用Books3数据集属于合理使用,无需获得许可或支付补偿。
  • Meta对集体诉讼的合法性提出异议,拒绝向作家提供经济补偿。
  • Books3数据集部分内容来自盗版网站Bibliotik,已被要求下架,面临数字存档禁令。
➡️

继续阅读