爱范儿 ·

17 万本盗版书，是「ChatGPT 们」变聪明的秘密

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

OpenAI和Meta被起诉未经授权使用作家的书籍训练模型。17万本盗版图书被用作Meta的训练素材。纽约时报考虑起诉OpenAI，可能命令销毁ChatGPT的数据集。AI公司的侵权问题成为AI发展的关键因素之一。

🎯

关键要点

OpenAI和Meta被起诉，未经授权使用作家的书籍训练模型。
原告提供证据，表明ChatGPT能总结出他们书的内容。
Meta的LLaMA模型使用了包含盗版书籍的训练数据集。
作家Alex Reisner揭露了Meta模型背后的盗版书籍来源。
Reisner通过程序提取了Books3数据集中的书籍信息，识别出17万本书。
Books3数据集中包含了多位著名作家的作品，证实了Meta的侵权行为。
Books3的创造者希望提供开放的训练数据，反对大公司的垄断。
《纽约时报》考虑起诉OpenAI，可能导致其数据集被销毁。
法律争议的关键在于AI公司是否能证明其使用是合理的。
版权问题将是决定AI未来发展的关键因素之一。

🏷️

继续阅读

早报｜努比亚确认推出全球首款AI智能体手机/法拉利高管:中国车企做的是快消品/华为天才少年回应DeepSeek面试争议
工信部提醒用户Claude Code存在安全后门隐患，建议升级。OpenAI将发布GPT-5.6系列模型。努比亚推出全球首款AI智能体手机。SpaceX股...
Meta reportedly正在研发一种智能眼镜，能够持续录音
Meta正在研发一种“超级感知”智能眼镜，具备持续录音和拍照功能。用户可以询问Meta AI关于捕获的音频和图像，但数据可能不会直接提供给用户。这款眼镜引...
Meta称已赶上OpenAI，但缺少一项关键因素。
Meta的AI负责人Wang在内部会议上表示，其模型“Watermelon”在某些基准上已赶上OpenAI的GPT-5.5，但未提供可验证的数据。Zuck...
OpenAI的安全卡片显示GPT-5.6存在撒谎问题
OpenAI将于周四发布GPT-5.6，包含Sol、Terra和Luna三个模型。Sol是旗舰模型，Terra则以更低成本提供相似性能，吸引开发者关注。开...
我们对政府与国家安全合作伙伴关系的看法
各国政府在国家安全等重要领域开始使用前沿人工智能（AI）系统，要求AI实验室、政府和社会共同探讨这些工具的使用。OpenAI发布国家安全原则，确保AI技术...
帮助K-12教育工作者提升实用AI技能
OpenAI Academy与沃尔顿家族基金会合作，将于夏季举办K-12教育者AI技能研讨会，旨在帮助教师和管理者有效利用AI工具。研讨会将吸引1600多...

内容提要

关键要点

标签

继续阅读