本研究推出基准EasyMath,旨在提升小型语言模型的数学推理能力,涵盖十三类问题。测试结果表明,模型规模和训练程度均能提高准确性,链式思维有助于提升表现,而一致性在模型规模增大时显著改善。
完成下面两步后,将自动完成登录并继续当前操作。