小红花·文摘

本研究探讨了路径星任务，发现解码器模型在此任务中表现不佳，原因是过量监督导致学习捷径。提出解决方案后，证明该任务可通过解码器模型有效解决，为语言模型训练提供新见解。

BriefGPT - AI 论文速递 ·

本研究以花园路径句子为案例，提出了分析GPT-2内部状态的方法。研究发现，否定标记对动词对象明确的句子的表示影响较小，而对语态造成歧义的明确句子的表示影响更大。同时，分析解码器模型的隐藏状态可以揭示可能会产生花园路径效应的歧义期。

BriefGPT - AI 论文速递 ·