💡
原文中文,约10700字,阅读约需26分钟。
📝
内容提要
Anthropic指控三家中国大模型公司(Deepseek、Kimi、Minimax)通过蒸馏其模型并提供日志和交互数据作为证据。蒸馏是否构成抄袭存在争议,Anthropic认为这些公司通过混淆账号和IP地址进行不当行为。尽管Deepseek V4尚未发布,相关指控已引发关注,未来可能面临法律后果。
🎯
关键要点
- Anthropic指控三家中国大模型公司(Deepseek、Kimi、Minimax)蒸馏其模型。
- Anthropic通过日志筛选和交互数据提供证据,发现三家公司使用了2.4万个假账号进行1,600万次交互。
- 中国公司通过账号混淆与Anthropic的Claude模型进行对话,避免被发现。
- Deepseek主要进行强化学习评分、推理能力蒸馏和内容引导训练。
- Kimi专注于代理能力、多模态智能体的训练,进行推理轨迹重构。
- Minimax进行代理编程和工具使用的训练,快速追踪Anthropic新模型的能力更新。
- Anthropic的指控被认为是针对Deepseek V4的准备,尽管该模型尚未发布。
- 蒸馏是否构成抄袭存在争议,蒸馏过程类似于学习和刷题,但涉及版权和用户协议的灰色地带。
- 大模型输出内容没有版权,使用大模型生成的结果进行训练可能违反用户协议。
- Anthropic可能面临起诉的复杂性,尤其是在中国公司之间的法律问题。
- Deepseek的用户协议允许蒸馏训练,成为唯一的例外。
- 历史上,微软的Bing曾被指控蒸馏谷歌的搜索结果,但未被起诉。
- 中美大模型之战仍在继续,Anthropic在AI Agent领域处于领先地位。
➡️