量子位 ·

爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

爱思唯尔等学术出版商起诉Meta，指控其未经授权使用受版权保护的科研论文训练Llama大模型。诉状称Meta主要依赖Common Crawl数据集及盗版平台LibGen和Sci-Hub。Meta回应将积极应诉，并主张“合理使用”原则。这是学术出版商首次集体对AI企业提起诉讼，未来发展引人关注。

🎯

🔎

此次爱思唯尔等学术出版商集体起诉Meta，标志着学术界对AI企业的版权维权进入新阶段。这不仅是对Meta的挑战，也可能影响未来AI模型的训练方式，尤其是在使用版权作品方面的法律界限。

Meta主张的“合理使用”原则在法律上仍存在争议。虽然有法院案例支持AI训练的合理使用，但整体法律环境尚不明确，未来的判决可能会对整个行业产生深远影响，值得关注。

诉状中提到的LibGen和Sci-Hub等盗版平台再次成为焦点。这些平台的存在不仅影响了学术出版商的利益，也为AI企业提供了潜在的法律风险，提醒相关企业在数据来源上需更加谨慎。

❓

爱思唯尔起诉Meta是因为其未经授权使用受版权保护的科研论文来训练Llama大模型。

Meta回应称将积极应诉，并主张“合理使用”原则，认为AI训练属于版权豁免情形。

这是学术出版商首次集体对AI企业提起诉讼，标志着版权维权战的升级。

Meta主要依赖Common Crawl数据集及盗版平台LibGen和Sci-Hub进行模型训练。

这场诉讼可能会影响AI行业的版权法律框架，尤其是关于使用版权作品训练模型的合法性。

目前，利用版权作品训练大语言模型的合法性尚未形成明确的司法判例。

🏷️