量子位 ·

中国大模型首登Nature封面！DeepSeek首次披露：R1训练只花200万

💡 原文中文，约3000字，阅读约需7分钟。

📝

内容提要

DeepSeek首次登上《Nature》封面，创始人梁文锋表示“中国AI不可能永远跟随”。R1模型的训练成本约为200万人民币，成为首个经过同行评审的大型语言模型，具有深远影响。该模型数据来源多样，安全性评估中等，展现出透明性与开源精神。

🎯

🔎

DeepSeek的成功标志着中国在AI领域的崛起，首次登上《Nature》封面，显示出中国企业在全球科技竞争中的实力。创始人梁文锋的言论强调了中国AI不再是跟随者的决心，未来可能会引领更多创新。

R1模型的训练成本仅为约200万人民币，相比于其他大型模型动辄上千万的投入，显示出其高效性。这一成本优势可能会促使更多企业探索类似的高效训练方法，降低AI研发的门槛。

DeepSeek发布的安全评估显示R1模型的安全性处于中等水平，强调了开源技术在传播中的潜在风险。随着AI技术的普及，安全性评估将成为开发和应用AI模型时不可忽视的关键环节。

❓

R1模型是首个经过同行评审的大型语言模型，训练成本仅约200万人民币，展现出卓越的推理能力和开源精神。

R1模型的数据来源包括数学、编程、STEM、逻辑和通用等五种类型的数据。

DeepSeek发布了详细的安全评估，涵盖风险控制系统和多语言安全性评估，模型的安全性总体处于中等水平。

R1模型采用纯强化学习框架，通过自我演化发展推理能力，核心在于奖励信号基于最终答案的正确性。

R1模型的影响力获得Nature封面认可，标志着中国AI的崛起，引用和下载量均表现优异。

DeepSeek在HuggingFace上公开了R1和R1-Zero的模型权重，体现了其透明性与开源精神。

🏷️