Meta 承认使用盗版书籍来训练 AI,并拒绝赔偿作家
💡
原文中文,约900字,阅读约需2分钟。
📝
内容提要
科技巨头Meta因使用包含大量盗版书籍的数据集训练语言模型而面临集体诉讼。Meta承认使用了Books3数据集,但拒绝向作者支付补偿。OpenAI和微软也因使用受版权保护的材料训练AI模型而被诉。
🎯
关键要点
- Meta因使用包含大量盗版书籍的Books3数据集训练语言模型而面临集体诉讼。
- Meta承认使用Books3数据集,但拒绝向作者支付补偿。
- Books3数据集包含19.5万本图书,容量近37GB,由AI研究者Shawn Presser于2020年创建。
- Books3中包含大量从盗版网站Bibliotik爬取的受版权保护作品,导致Meta面临法律风险。
- OpenAI和微软也因使用受版权保护的材料训练AI模型而被诉。
- OpenAI辩称不使用受版权保护的材料训练AI模型几乎不可能,并要求法院驳回诉讼。
- Meta声称其使用Books3数据集属于合理使用,无需获得许可或支付补偿。
- Meta对集体诉讼的合法性提出异议,拒绝向作家提供经济补偿。
- Books3数据集部分内容来自盗版网站Bibliotik,已被要求下架,面临数字存档禁令。
➡️