开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

💡 原文中文,约6600字,阅读约需16分钟。
📝

内容提要

Open R1项目旨在完全复现DeepSeek-R1,已发布OpenR1-Math-220k数据集,生成22万条高质量推理数据,支持小模型达到与DeepSeek相当的性能,推动开源社区发展。

🎯

关键要点

  • Open R1项目旨在完全复现DeepSeek-R1,推动开源社区发展。
  • Open R1项目已发布OpenR1-Math-220k数据集,生成22万条高质量推理数据。
  • Open R1团队使用DeepSeek R1生成80万条推理轨迹,筛选后得到22万条高质量数据。
  • OpenR1-Math-220k数据集支持小模型达到与DeepSeek相当的性能。
  • 数据集分为default和extended两个部分,分别包含94k和131k问题。
  • Open R1团队与Numina合作,改进数据生成和验证过程。
  • 数据生成过程中,使用了vLLM和SGLang技术提高生成效率。
  • Open R1团队设计了数学验证系统,确保数据质量。
  • 研究表明,少量高质量样本可以提升模型的推理能力。
  • Open R1团队正在探索GRPO的影响,进行广泛实验以优化训练过程。
➡️

继续阅读