爱范儿 ·

Anthropic「蒸馏」了人类最大的知识库

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

美国AI公司Anthropic启动“巴拿马项目”，将新书切割、扫描后销毁以获取高质量数据训练模型。尽管公司声称未用于正式模型，但其行为引发版权争议，最终以15亿美元和解，未承认违法。这一事件反映了AI对创作者权益的冲击。

🎯

🔎

Anthropic的行为引发了广泛的版权争议，反映出AI行业对创作者权益的冲击。尽管公司支付了15亿美元的和解金，但这一赔偿远低于法律上限，显示出创作者在与大型科技公司对抗时的脆弱地位。

随着AI技术的发展，传统创作者面临着前所未有的竞争压力。AI生成的内容以低成本涌入市场，进一步压缩了作家的生存空间。这种现象不仅影响了创作者的收入，也可能改变整个文化创作生态。

法院裁定AI训练属于合理使用，给了AI公司一个法律上的保护伞。然而，这种法律逻辑是否合理仍值得深思。AI的训练方式与人类学习的本质不同，简单的法律条款无法涵盖其对创作行业的深远影响。

❓

Anthropic的“巴拿马项目”涉及切割、扫描并销毁书籍，以获取高质量数据用于训练AI模型。

Anthropic认为书籍的内容比网络文本更具价值，且通过授权获取数据成本高、耗时长。

Anthropic最终以15亿美元和解，但未承认任何违法行为，法院裁定其训练行为属于合理使用。

创作者对出版商和AI公司的不满加剧，认为赔偿标准远低于法律上限，生存空间被挤压。

Anthropic主要依赖二手书零售商进行书籍采购，并通过工业化流程进行扫描。

AI可以在短时间内消化大量书籍并低成本复制输出，而人类阅读则是逐本进行，无法实现同样的规模。

🏷️