小红花·文摘

本研究推出基准EasyMath，旨在提升小型语言模型的数学推理能力，涵盖十三类问题。测试结果表明，模型规模和训练程度均能提高准确性，链式思维有助于提升表现，而一致性在模型规模增大时显著改善。