活在当下：大型语言模型能否把握同时推理？

BriefGPT - AI 论文速递 ·

本论文通过构建MenatQA评估大型语言模型（LLMs）在时间理解和推理能力方面的表现，发现大多数LLMs在处理时间因素时不如更小的时间推理模型，对时间偏差敏感且依赖问题中提供的时间信息。研究还探索了改进LLMs的潜在策略。

MenatQA 大型语言模型推理能力时间偏差时间理解

原文中文，约300字，阅读约需1分钟。