本文介绍了高质量的小学数学问题数据集GSM8K,指出大型变压器模型在多步数学推理中的表现不佳。提出通过验证器提高模型性能,利用自动生成的形式化代码排除不一致解,准确性提升超过12%。还探讨了自然逻辑运算符的应用和自我纠正训练在数学证明和推理中的有效性。
完成下面两步后,将自动完成登录并继续当前操作。