英伟达版Sora被曝违规抓取大量数据,官方表示不服
💡
原文中文,约2000字,阅读约需5分钟。
📝
内容提要
英伟达被曝违规抓取大量数据,官方表示不服。泄露文件显示,每天抓取非法数据训练新模型,员工被默许在网络上抓取未经授权的数据。英伟达回应称合法。
🎯
关键要点
-
英伟达版Sora被曝违规抓取大量数据,官方表示不服。
-
泄露文件显示,员工被默许每天抓取未经授权的数据。
-
英伟达回应称其做法完全合法,尊重内容创作者的权利。
-
Cosmos项目旨在构建先进的视频基础模型,涉及多个应用领域。
-
员工使用开源工具从YouTube、奈飞等平台抓取数据。
-
奈飞表示未与英伟达达成内容提取协议,YouTube也指出违反使用条款。
-
大厂非法抓取数据的事件屡见不鲜,原始数据对模型训练非常有用。
-
研究显示,使用高质量数据训练的大模型性能最佳。
➡️