小红花·文摘

本研究探讨如何利用大型语言模型（LLMs）从时间序列数据推断自然语言事件，填补研究空白。评估了16种LLMs，发现开放权重的DeepSeek-R1 32B模型优于GPT-4o等专有模型，并指出了改进方向。