爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型

爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型

💡 原文中文,约1700字,阅读约需4分钟。
📝

内容提要

爱思唯尔等学术出版商起诉Meta,指控其未经授权使用受版权保护的科研论文训练Llama大模型。诉状称Meta主要依赖Common Crawl数据集及盗版平台LibGen和Sci-Hub。Meta回应将积极应诉,并主张“合理使用”原则。这是学术出版商首次集体对AI企业提起诉讼,未来发展引人关注。

🎯

关键要点

  • 爱思唯尔等学术出版商起诉Meta,指控其未经授权使用受版权保护的科研论文训练Llama大模型。

  • 诉状称Meta主要依赖Common Crawl数据集及盗版平台LibGen和Sci-Hub。

  • 这是学术出版商首次集体对AI企业提起诉讼,标志着版权维权战的升级。

  • Meta回应将积极应诉,并主张“合理使用”原则,认为AI训练属于版权豁免情形。

  • 目前,利用版权作品训练大语言模型的合法性尚未形成明确的司法判例。

🔎

延伸解读

版权维权的新阶段

此次爱思唯尔等学术出版商集体起诉Meta,标志着学术界对AI企业的版权维权进入新阶段。这不仅是对Meta的挑战,也可能影响未来AI模型的训练方式,尤其是在使用版权作品方面的法律界限。

合理使用的法律争议

Meta主张的“合理使用”原则在法律上仍存在争议。虽然有法院案例支持AI训练的合理使用,但整体法律环境尚不明确,未来的判决可能会对整个行业产生深远影响,值得关注。

盗版平台的角色

诉状中提到的LibGen和Sci-Hub等盗版平台再次成为焦点。这些平台的存在不仅影响了学术出版商的利益,也为AI企业提供了潜在的法律风险,提醒相关企业在数据来源上需更加谨慎。

延伸问答

爱思唯尔起诉Meta的主要原因是什么?

爱思唯尔起诉Meta是因为其未经授权使用受版权保护的科研论文来训练Llama大模型。

Meta在回应诉讼时主张了什么原则?

Meta回应称将积极应诉,并主张“合理使用”原则,认为AI训练属于版权豁免情形。

这起诉讼的背景是什么?

这是学术出版商首次集体对AI企业提起诉讼,标志着版权维权战的升级。

Meta主要依赖哪些数据来源进行模型训练?

Meta主要依赖Common Crawl数据集及盗版平台LibGen和Sci-Hub进行模型训练。

这场诉讼可能对AI行业产生什么影响?

这场诉讼可能会影响AI行业的版权法律框架,尤其是关于使用版权作品训练模型的合法性。

目前关于AI训练使用版权作品的法律状况如何?

目前,利用版权作品训练大语言模型的合法性尚未形成明确的司法判例。

🏷️

标签

➡️

继续阅读