小红花·文摘

本研究探讨了大型语言模型在长度泛化方面的能力，提出了统一框架以改善其在算术推理任务中的表现。通过结合上下文学习和记事本提示，发现模型能够有效推广到更长输入。研究分析了影响长度泛化的因素，并提出了注意力偏置校准（ABC）方法，显著提升了模型在未知长度上的性能。