ArthModel: 提升大型语言模型的算术技能 通过训练语言模型生成与算数问题相关的后缀表达式,并将其与小型预训练模型结合,将令牌嵌入转化为真实稠密数字,通过深度学习平台的本地函数获得正确答案。最后,通过提示注入将小型模型的结果输出添加到语言模型中,从而增强了语言模型的算数能力。 该研究调查了语言模型在预测和问题解决能力方面的应用,以及在算术计算和内部信息处理方面的推广能力。研究结果支持了语言模型在数值空间中进行计算的假设。 内部信息处理 大型语言模型 算术计算 语言模型 问题解决能力 预测能力