量子位 ·

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

DeepSeek发布了R1技术报告的64页补充内容，详细介绍了模型训练路径和安全性评估。新版本涵盖冷启动、推理导向RL等四个步骤，提升了模型的推理能力和安全性，团队成员流失少，显示出良好的内部稳定性。

🎯

🔎

DeepSeek此次发布的补充材料展示了其在技术透明度上的努力。通过详细披露模型训练路径和安全性评估，DeepSeek不仅增强了研究的可复现性，也为其他研究者提供了宝贵的参考。这种开放的态度有助于推动整个AI领域的进步，尤其是在安全性和伦理性方面。

DeepSeek团队成员流失少，显示出良好的内部稳定性。这与硅谷一些公司的高流动性形成鲜明对比，反映出DeepSeek在人才管理和团队文化上的成功。稳定的团队有助于持续的技术创新和项目推进，可能为DeepSeek在竞争激烈的AI市场中赢得优势。

尽管DeepSeek-R1在安全性评估中表现良好，但在HarmBench测试集中的不佳表现提醒我们，开源模型的安全性仍然是一个重要挑战。开发者需要持续关注模型的潜在风险，确保其不会被滥用。这也强调了在AI开发中，安全性评估和风险控制的重要性。

❓

DeepSeek的R1技术报告补充了64页内容，详细介绍了模型训练路径和安全性评估。

训练路径包括冷启动、推理导向RL、拒绝采样和再微调、对齐导向RL四个步骤。

DeepSeek通过构建包含10.6万条提示的数据集，并使用点式训练方法来评估模型的安全性。

DeepSeek团队成员流失少，18位核心贡献者仍在团队中，显示出良好的内部稳定性。

DeepSeek-R1在HarmBench测试集中表现不佳，尤其在知识产权相关问题上。

补充材料的详细技术披露提升了R1的可复现性，提供了更多实现细节。

🏷️