爱范儿 ·

让 Anthropic 破防的「蒸馏」风波，美国 AI 大牛泼冷水：中国 AI 成功不靠走捷径

💡 原文中文，约4900字，阅读约需12分钟。

📝

内容提要

Anthropic 指控三家中国 AI 实验室通过虚假账号蒸馏其 Claude 模型。专家 Lambert 认为此事并不严重，强调蒸馏与强化学习的区别，指出蒸馏并非捷径，真正的创新依赖于强化学习。

🎯

🔎

蒸馏技术虽然可以让弱模型快速学习强模型的输出，但其本质上是模仿，而非创新。真正的创新依赖于强化学习，模型需要通过自主探索和试错来获得能力。因此，依赖蒸馏并不能保证模型的顶尖表现。

Anthropic 指控中国 AI 实验室蒸馏其模型，但自身也曾进行类似行为，这引发了双标的质疑。此事件不仅涉及技术问题，更反映出行业内对知识产权和道德标准的模糊界限。

蒸馏并非简单的复制过程，不同模型之间的数据分布差异可能导致效果不佳。成功的蒸馏需要大量的工程工作和对模型架构的深入理解，这使得其实施难度加大，不能被视为捷径。

❓

Anthropic 指控三家中国 AI 实验室通过虚假账号蒸馏其 Claude 模型，生成大量对话用于训练。

Nathan Lambert 认为蒸馏并不严重，强调蒸馏与强化学习的区别，真正的创新依赖于强化学习。

蒸馏是模仿强模型的输出，而强化学习则是通过探索和试错来提升模型能力。

是的，Anthropic 自身也曾进行过类似的蒸馏行为，因此其指控被认为存在双标问题。

蒸馏的有效性受到不同模型之间数据分布差异和模型架构差异的影响，需要大量工程工作才能发挥效果。

Anthropic 的公开指控可能与美国国防部的压力有关，试图维护其公司形象和市场地位。

🏷️