小红花·文摘

本研究探讨大型语言模型在干扰条件下的两跳推理能力，揭示其从随机猜测到精准推理的学习机制。通过训练三层变换器，发现模型初期受干扰影响，但最终能够忽略干扰，实现高准确率，为理解LLMs的推理过程提供新视角。