掩盖思路:简单地掩盖部分推理步骤可以提高语言模型对数学推理的学习能力
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究人员开发了一种无需外部资源的训练方法,通过对输入引入扰动提高了准确性。使用GSM8K进行微调时,相比标准有监督微调提高了5%的准确性。与现有方法相结合,在不同质量和大小的数据集上分别提高了3%和1%的准确性。通过案例研究和定量分析,研究人员发现这种改进的机制可能为模型提供更好的支持。
🎯
关键要点
-
研究人员开发了一种无需外部资源的训练方法,通过对输入引入扰动提高准确性。
-
在使用GSM8K进行微调时,该方法相比标准有监督微调提高了5%的准确性。
-
与现有方法结合时,该方法在不同质量和大小的数据集上分别提高了3%和1%的准确性。
-
案例研究和定量分析表明,该方法可能在捕获长距离依赖性方面为模型提供更好的支持。
-
这种增强有助于加深对问题前提和先前步骤的理解。
-
研究人员的代码在Github上可用。
➡️