Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了Big-Math数据集,包含超过25万个高质量数学问题,专为语言模型的强化学习设计。通过严格筛选,确保问题的可验证性和开放性,并新增47000个问题,以提升语言模型的推理能力。
🎯
关键要点
- 本研究提出了Big-Math数据集,包含超过25万个高质量数学问题。
- Big-Math数据集专为语言模型的强化学习设计。
- 通过严格筛选,确保问题的可验证性和开放性。
- 新增47000个问题,以提升语言模型的推理能力。
- 解决了现有数学数据集在质量和数量之间的权衡问题。
➡️