小红花·文摘

大型语言模型在图推理问题上有潜力，但在真实任务中推广能力有限。NLGift基准测试显示，LLMs在简单模式上表现不错，但复杂推理和真实任务中仍有困难。研究发现后训练对齐对真实任务最有效，但超越模式记忆仍是挑战。

基于大型语言模型的多智能体可扩展和准确的图推理

BriefGPT - AI 论文速递 ·

大型语言模型在图推理问题上有潜力，但在真实任务中推广能力有限。NLGift基准测试显示，LLMs在简单模式上表现不错，但在复杂推理和真实任务中有困难。研究发现，后训练对齐对真实任务最有效，但超越模式记忆仍具挑战。

通过伪代码提示的图推理与大型语言模型

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）在图推理方面有潜力，但对于其在真实世界任务中的推广能力仍存在疑问。NLGift基准测试评估了LLMs在图推理可推广性方面的表现，结果显示LLMs在推理和真实世界模式下的推广能力有限。研究发现后训练对齐是提高LLMs图推理可推广性的最有希望的策略。

GraphInsight：在大型语言模型中解锁图结构理解的洞见

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）在图推理方面有潜力，但对于其是否能够学习可推广的图推理技能还不清楚。研究者提出了NLGift基准测试，评估LLMs在真实世界图任务上的效用。实验结果显示LLMs在简单模式下表现良好，但在推理和真实世界模式下难以推广。研究者探索了三种改进LLM图推理可推广性的策略，发现后训练对齐是最有希望的，但超越模式记忆仍是一个未解决的问题。

CodeGraph：利用代码增强大型语言模型的图推理能力

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）在图推理能力上有潜力，但对于学习可推广的技能还不确定。NLGift基准测试评估了LLMs在真实世界图任务上的效用，结果显示推理和真实世界模式下推广困难。后训练对齐是改进LLM图推理可推广性的最有希望的策略。

GraCoRe：大型语言模型中的图推理与复杂推理基准测试

BriefGPT - AI 论文速递 ·