本研究针对开源大型语言模型在数学推理方面的不足,提出了课程学习和分解策略。实验结果显示,WizardMath 7B在英语数据集上超越Gemini,在印地语上表现相当,表明双语方法有效提升数学推理能力。
本研究探讨了大语言模型生成内容的事实验证中去语境化与分解策略的相互作用。引入DnDScore方法,发现策略选择显著影响事实性得分,为长文本生成的验证提供了新思路。
完成下面两步后,将自动完成登录并继续当前操作。