EasyMath:一种针对小型语言模型的零-shot数学基准
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究推出基准EasyMath,旨在提升小型语言模型的数学推理能力,涵盖十三类问题。测试结果表明,模型规模和训练程度均能提高准确性,链式思维有助于提升表现,而一致性在模型规模增大时显著改善。
🎯
关键要点
-
本研究推出基准EasyMath,旨在提升小型语言模型的数学推理能力。
-
EasyMath涵盖十三个类别的问题,包括基本算术和代数表达式。
-
该基准填补了现有基准的空白。
-
通过对23个模型进行零-shot测试,发现模型的准确性随模型规模与训练而提升。
-
链式思维虽然有一定增益,但整体一致性在模型规模增大时显著改善。
🏷️