💡 原文中文,约10700字,阅读约需26分钟。
📝

内容提要

Anthropic指控三家中国大模型公司(Deepseek、Kimi、Minimax)通过蒸馏其模型并提供日志和交互数据作为证据。蒸馏是否构成抄袭存在争议,Anthropic认为这些公司通过混淆账号和IP地址进行不当行为。尽管Deepseek V4尚未发布,相关指控已引发关注,未来可能面临法律后果。

🎯

关键要点

  • Anthropic指控三家中国大模型公司(Deepseek、Kimi、Minimax)蒸馏其模型。
  • Anthropic通过日志筛选和交互数据提供证据,发现三家公司使用了2.4万个假账号进行1,600万次交互。
  • 中国公司通过账号混淆与Anthropic的Claude模型进行对话,避免被发现。
  • Deepseek主要进行强化学习评分、推理能力蒸馏和内容引导训练。
  • Kimi专注于代理能力、多模态智能体的训练,进行推理轨迹重构。
  • Minimax进行代理编程和工具使用的训练,快速追踪Anthropic新模型的能力更新。
  • Anthropic的指控被认为是针对Deepseek V4的准备,尽管该模型尚未发布。
  • 蒸馏是否构成抄袭存在争议,蒸馏过程类似于学习和刷题,但涉及版权和用户协议的灰色地带。
  • 大模型输出内容没有版权,使用大模型生成的结果进行训练可能违反用户协议。
  • Anthropic可能面临起诉的复杂性,尤其是在中国公司之间的法律问题。
  • Deepseek的用户协议允许蒸馏训练,成为唯一的例外。
  • 历史上,微软的Bing曾被指控蒸馏谷歌的搜索结果,但未被起诉。
  • 中美大模型之战仍在继续,Anthropic在AI Agent领域处于领先地位。
➡️

继续阅读