ArthModel: 提升大型语言模型的算术技能

通过训练语言模型生成与算数问题相关的后缀表达式,并将其与小型预训练模型结合,将令牌嵌入转化为真实稠密数字,通过深度学习平台的本地函数获得正确答案。最后,通过提示注入将小型模型的结果输出添加到语言模型中,从而增强了语言模型的算数能力。

该研究调查了语言模型在预测和问题解决能力方面的应用,以及在算术计算和内部信息处理方面的推广能力。研究结果支持了语言模型在数值空间中进行计算的假设。

原文中文,约200字,阅读约需1分钟。发表于:
阅读原文