A Mathematical Data Selection Framework Using Skill Graphs for Pretraining Large Language Models

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出MASS框架,旨在解决大型语言模型预训练中的数据选择问题。该框架通过数学推理技能图有效捕捉数学技能及其关系,实验结果显示显著提升了模型的训练效率和效果。

🎯

关键要点

  • 本研究提出MASS框架,旨在解决大型语言模型预训练中的数据选择问题。
  • MASS框架基于数学推理领域的技能图,有效捕捉数学技能及其关系。
  • 实验结果表明,利用MASS选择的数据子集显著提高了模型训练的效率和效果。
  • MASS框架在减少训练标记的同时,提升了模型性能。
➡️

继续阅读