FreeBuf网络安全行业门户 ·

Meta 承认使用盗版书籍来训练 AI，并拒绝赔偿作家

💡 原文中文，约900字，阅读约需2分钟。

📝

内容提要

科技巨头Meta因使用包含大量盗版书籍的数据集训练语言模型而面临集体诉讼。Meta承认使用了Books3数据集，但拒绝向作者支付补偿。OpenAI和微软也因使用受版权保护的材料训练AI模型而被诉。

🎯

关键要点

Meta因使用包含大量盗版书籍的Books3数据集训练语言模型而面临集体诉讼。
Meta承认使用Books3数据集，但拒绝向作者支付补偿。
Books3数据集包含19.5万本图书，容量近37GB，由AI研究者Shawn Presser于2020年创建。
Books3中包含大量从盗版网站Bibliotik爬取的受版权保护作品，导致Meta面临法律风险。
OpenAI和微软也因使用受版权保护的材料训练AI模型而被诉。
OpenAI辩称不使用受版权保护的材料训练AI模型几乎不可能，并要求法院驳回诉讼。
Meta声称其使用Books3数据集属于合理使用，无需获得许可或支付补偿。
Meta对集体诉讼的合法性提出异议，拒绝向作家提供经济补偿。
Books3数据集部分内容来自盗版网站Bibliotik，已被要求下架，面临数字存档禁令。

🏷️

标签

Meta ai 合理使用数据集盗版书籍集体诉讼

➡️

继续阅读

产教协同赋能 AI 创新，华为云高校公开课落地大连理工大学
7月10日预授课环节，华为云开发者运营使能专家路都行带来了“华为云码道（CodeArts）代码智能体原理与实战入门”议题，详细讲解华为云码道的核心能力、云...
从 Token 价格战到成功任务单位经济学：AI 成本战的真正主线（上） - 张善友
AI 行业过去最喜欢讲的是"能力"，今天越来越必须讲的是"结果"。"有用智能每人民币"（Useful In...
Built in Fort Worth: Wistron Opens Advanced Manufacturing Plant to Produce NVIDIA AI Systems
The AI era runs on AI infrastructure. Many of these advanced systems are buil...
Neill Blomkamp’s new zombie AI ‘film’ is just slop warmed over
On Monday, District 9 and Gran Turismo director Neill Blomkamp unveiled his l...
Substack adds an AI detector to help spot blogs written by no one
Substack will now help users determine whether what they're reading may h...
Android Studio Quail 2 Redesigns Agent Mode, Streamlines AI-Assisted Coding
The latest release of Android Studio, Quail 2, now stable, expands Gemini/AI ...