1600万次偷跑曝光!Deepseek与Minimax如何偷偷蒸馏Anthropic?

1600万次偷跑曝光!Deepseek与Minimax如何偷偷蒸馏Anthropic?

💡 原文中文,约10700字,阅读约需26分钟。
📝

内容提要

Anthropic指控三家中国大模型公司(Deepseek、Kimi、Minimax)通过蒸馏其模型并提供日志和交互数据作为证据。蒸馏是否构成抄袭存在争议,Anthropic认为这些公司通过混淆账号和IP地址进行不当行为。尽管Deepseek V4尚未发布,相关指控已引发关注,未来可能面临法律后果。

🎯

关键要点

  • Anthropic指控三家中国大模型公司(Deepseek、Kimi、Minimax)蒸馏其模型。
  • Anthropic通过日志筛选和交互数据提供证据,发现三家公司使用了2.4万个假账号进行1,600万次交互。
  • 中国公司通过账号混淆与Anthropic的Claude模型进行对话,避免被发现。
  • Deepseek主要进行强化学习评分、推理能力蒸馏和内容引导训练。
  • Kimi专注于代理能力、多模态智能体的训练,进行推理轨迹重构。
  • Minimax进行代理编程和工具使用的训练,快速追踪Anthropic新模型的能力更新。
  • Anthropic的指控被认为是针对Deepseek V4的准备,尽管该模型尚未发布。
  • 蒸馏是否构成抄袭存在争议,蒸馏过程类似于学习和刷题,但涉及版权和用户协议的灰色地带。
  • 大模型输出内容没有版权,使用大模型生成的结果进行训练可能违反用户协议。
  • Anthropic可能面临起诉的复杂性,尤其是在中国公司之间的法律问题。
  • Deepseek的用户协议允许蒸馏训练,成为唯一的例外。
  • 历史上,微软的Bing曾被指控蒸馏谷歌的搜索结果,但未被起诉。
  • 中美大模型之战仍在继续,Anthropic在AI Agent领域处于领先地位。

延伸问答

Anthropic指控Deepseek等公司蒸馏其模型的依据是什么?

Anthropic通过日志筛选和交互数据发现,Deepseek、Kimi和Minimax使用了2.4万个假账号进行1,600万次交互,认为这些行为构成了蒸馏其模型的证据。

Deepseek、Kimi和Minimax各自的训练重点是什么?

Deepseek主要进行强化学习评分和推理能力蒸馏,Kimi专注于代理能力和多模态智能体的训练,而Minimax则进行代理编程和工具使用的训练。

蒸馏是否构成抄袭的争议点是什么?

蒸馏的过程类似于学习和刷题,但涉及版权和用户协议的灰色地带,是否构成抄袭存在争议。

Deepseek V4尚未发布,但为何Anthropic仍然对其提出指控?

Anthropic的指控被认为是针对Deepseek V4的准备,尽管该模型尚未发布,但Anthropic希望通过指控来施加压力。

Anthropic可能面临哪些法律后果?

Anthropic可能面临起诉的复杂性,尤其是在中国公司之间的法律问题,起诉可能涉及违反用户协议。

Deepseek的用户协议与其他公司的有什么不同?

Deepseek的用户协议允许蒸馏训练,成为唯一的例外,而其他公司的协议通常禁止使用蒸馏数据训练竞争对手的模型。

➡️

继续阅读