本研究探讨如何利用大型语言模型(LLMs)从时间序列数据推断自然语言事件,填补研究空白。评估了16种LLMs,发现开放权重的DeepSeek-R1 32B模型优于GPT-4o等专有模型,并指出了改进方向。
完成下面两步后,将自动完成登录并继续当前操作。