Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了Big-Math数据集,包含超过25万个高质量数学问题,专为语言模型的强化学习设计。通过严格筛选,确保问题的可验证性和开放性,并新增47000个问题,以提升语言模型的推理能力。

🎯

关键要点

  • 本研究提出了Big-Math数据集,包含超过25万个高质量数学问题。
  • Big-Math数据集专为语言模型的强化学习设计。
  • 通过严格筛选,确保问题的可验证性和开放性。
  • 新增47000个问题,以提升语言模型的推理能力。
  • 解决了现有数学数据集在质量和数量之间的权衡问题。
➡️

继续阅读