本研究探讨了路径星任务,发现解码器模型在此任务中表现不佳,原因是过量监督导致学习捷径。提出解决方案后,证明该任务可通过解码器模型有效解决,为语言模型训练提供新见解。
完成下面两步后,将自动完成登录并继续当前操作。