本研究探讨大型语言模型在干扰条件下的两跳推理能力,揭示其从随机猜测到精准推理的学习机制。通过训练三层变换器,发现模型初期受干扰影响,但最终能够忽略干扰,实现高准确率,为理解LLMs的推理过程提供新视角。
完成下面两步后,将自动完成登录并继续当前操作。