回到未来:面向大型语言模型的可解释性时间推理

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

该研究介绍了一种名为TODAY的任务,旨在通过评估模型能否正确理解渐进变化的影响,来进行时间推理的迁移学习。研究发现当前的模型更多地依赖虚假信息而非恰当的推理来进行时间预测,并证明了TODAY的监督风格和解释注释可以用于联合学习,以鼓励模型在训练期间使用更适当的信号,并在多个基准测试中实现优异性能。

原文中文,约300字,阅读约需1分钟。
阅读原文