本研究提出了ChronoSense基准,用于评估大型语言模型的时间理解能力。通过16个任务,发现现有模型在处理时间关系和时间算术时存在显著差异,并且依赖于记忆。这为提升模型的时间理解提供了重要依据。
本研究提出了EventFull工具,旨在解决事件关系检测中的系统性和完整性问题。该工具支持时间、因果和指称关系的统一标注,显著加快和简化了标注过程,提高了标注者之间的一致性。
本文介绍了一种基于数据密集的方法来推断句内时间关系,以实现NLP应用中的时间信息提取和综合。该方法利用标记避免手动编码,训练模型可以在未看到的情况下选择正确的标记。同时,文章比较了许多概率模型在不同方面的差异,评估了该方法是否有望半自动创建时间注释。
完成下面两步后,将自动完成登录并继续当前操作。