小红花·文摘

本研究提出了ChronoSense基准，用于评估大型语言模型的时间理解能力。通过16个任务，发现现有模型在处理时间关系和时间算术时存在显著差异，并且依赖于记忆。这为提升模型的时间理解提供了重要依据。

BriefGPT - AI 论文速递 ·

本研究提出了EventFull工具，旨在解决事件关系检测中的系统性和完整性问题。该工具支持时间、因果和指称关系的统一标注，显著加快和简化了标注过程，提高了标注者之间的一致性。

BriefGPT - AI 论文速递 ·

本文介绍了一种基于数据密集的方法来推断句内时间关系，以实现NLP应用中的时间信息提取和综合。该方法利用标记避免手动编码，训练模型可以在未看到的情况下选择正确的标记。同时，文章比较了许多概率模型在不同方面的差异，评估了该方法是否有望半自动创建时间注释。

BriefGPT - AI 论文速递 ·