开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

💡 原文中文,约6600字,阅读约需16分钟。
📝

内容提要

Open R1项目旨在完全复现DeepSeek-R1,已发布OpenR1-Math-220k数据集,生成22万条高质量推理数据,支持小模型达到与DeepSeek相当的性能,推动开源社区发展。

🎯

关键要点

  • Open R1项目旨在完全复现DeepSeek-R1,推动开源社区发展。
  • Open R1项目已发布OpenR1-Math-220k数据集,生成22万条高质量推理数据。
  • Open R1团队使用DeepSeek R1生成80万条推理轨迹,筛选后得到22万条高质量数据。
  • OpenR1-Math-220k数据集支持小模型达到与DeepSeek相当的性能。
  • 数据集分为default和extended两个部分,分别包含94k和131k问题。
  • Open R1团队与Numina合作,改进数据生成和验证过程。
  • 数据生成过程中,使用了vLLM和SGLang技术提高生成效率。
  • Open R1团队设计了数学验证系统,确保数据质量。
  • 研究表明,少量高质量样本可以提升模型的推理能力。
  • Open R1团队正在探索GRPO的影响,进行广泛实验以优化训练过程。

延伸问答

Open R1项目的主要目标是什么?

Open R1项目旨在完全复现DeepSeek-R1,推动开源社区的发展。

OpenR1-Math-220k数据集包含多少条高质量推理数据?

OpenR1-Math-220k数据集生成了22万条高质量推理数据。

Open R1团队是如何生成高质量数据的?

Open R1团队使用DeepSeek R1生成80万条推理轨迹,经过筛选和验证后得到22万条高质量数据。

OpenR1-Math-220k数据集的两个部分分别是什么?

数据集分为default(94k问题)和extended(131k问题)两个部分。

Open R1团队与哪个机构合作改进数据生成和验证过程?

Open R1团队与Numina合作,改进数据生成和验证过程。

Open R1项目如何确保生成数据的质量?

Open R1团队设计了数学验证系统,确保数据质量,并通过自动过滤保留至少有一个正确答案的问题。

➡️

继续阅读