小红花·文摘

该研究提出使用六十甲子周期替代公历年，以解决大型语言模型在长期时间跨度上的时间对齐问题，并采用极坐标模型增强时间理解，显著提升模型在时间相关任务中的表现。实验结果验证了该方法的有效性。

Ticktack: Long-Term Temporal Alignment of Large Language Models

BriefGPT - AI 论文速递 ·

代理的当前日期和时间

DEV Community ·

本研究提出了ChronoSense基准，用于评估大型语言模型的时间理解能力。通过16个任务，发现现有模型在处理时间关系和时间算术时存在显著差异，并且依赖于记忆。这为提升模型的时间理解提供了重要依据。

ChronoSense：探索大型语言模型中的时间理解与事件的时间间隔

BriefGPT - AI 论文速递 ·

本论文通过构建MenatQA来评估大型语言模型（LLMs）在时间理解和推理能力方面的表现。结果显示，大多数LLMs在处理时间因素时不如更小的时间推理模型，并且对时间偏差敏感，且依赖于问题中提供的时间信息。同时，研究还探索了改进LLMs的潜在策略。

大型语言模型中的时间盲点

BriefGPT - AI 论文速递 ·

本论文通过构建MenatQA来评估大型语言模型在时间理解和推理能力方面的表现，并测试了不同参数大小的主流LLMs。结果表明，大多数LLMs在处理时间因素时不如更小的时间推理模型，并且对时间偏差的敏感度较高，且严重依赖于问题中提供的时间信息。本文还探索了通过具体提示和外部工具来改进LLMs的潜在策略，为未来的研究提供了有价值的基准或参考。

通过多跳问答数据集和伪指导调整实现大型语言模型的鲁棒性时序推理

BriefGPT - AI 论文速递 ·

本文评估了大型语言模型在时间理解和推理能力方面的表现，并测试了不同参数大小的主流模型。结果表明，大多数模型在处理时间因素时不如更小的时间推理模型，并且对时间偏差的敏感度较高。本文还探索了改进模型的潜在策略，为未来的研究提供了有价值的基准或参考。

基于时间感知的表示学习在时间敏感问答中的应用

BriefGPT - AI 论文速递 ·