本文提出了LLM4DyG基准,评估大型语言模型在动态图中的时空理解能力。实验分析了不同因素对模型性能的影响,并提出DST2方法以增强时空理解。主要发现包括LLMs具备初步的时空理解能力,动态图任务的难度随图的大小和密度增加,但对时间跨度和数据生成机制不敏感。数据和代码将开源。
本文通过提出评估大型语言模型在动态图中的时空理解能力的基准,系统地评估了LLMs在动态图中的时空信息理解能力,并提出了一种名为DST2的方法来增强LLMs在动态图中的时空理解能力。实验结果表明,LLMs在动态图中具有初步的时空理解能力,而DST2提示方法可以帮助提高其性能。
本文提出了评估大型语言模型在动态图中的时空理解能力的 LLM4DyG 基准,并通过广泛的实验分析了不同的数据生成器、数据统计、提示技术和 LLMs 对模型性能的影响。作者提出了一种名为 DST2 的方法,用于增强 LLMs 在动态图中的时空理解能力。实验结果表明,LLMs 在动态图中具有初步的时空理解能力,而 DST2 提示方法可以帮助提高 LLMs 在动态图中的时空理解能力。
完成下面两步后,将自动完成登录并继续当前操作。