EasyMath:一种针对小型语言模型的零-shot数学基准

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究推出基准EasyMath,旨在提升小型语言模型的数学推理能力,涵盖十三类问题。测试结果表明,模型规模和训练程度均能提高准确性,链式思维有助于提升表现,而一致性在模型规模增大时显著改善。

🎯

关键要点

  • 本研究推出基准EasyMath,旨在提升小型语言模型的数学推理能力。
  • EasyMath涵盖十三个类别的问题,包括基本算术和代数表达式。
  • 该基准填补了现有基准的空白。
  • 通过对23个模型进行零-shot测试,发现模型的准确性随模型规模与训练而提升。
  • 链式思维虽然有一定增益,但整体一致性在模型规模增大时显著改善。
➡️

继续阅读