BriefGPT - AI 论文速递 ·

支持不完整用户查询的 LLM + 推理 + 规划在 API 存在的情况下

自主生成可执行计划的成功率仅约为3%。

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本研究探讨大型语言模型（LLMs）在规划任务中的应用，发现其在将自然语言目标转化为结构化计划方面表现有限，尤其在数字和物理推理任务中。通过结合传统规划器与LLMs，提出了LLM + P框架，有效解决规划问题。此外，研究开发了基于LLMs的计划能力评估，显示自主生成可执行计划的成功率仅约3%。

🎯

❓

大型语言模型在将自然语言目标转化为结构化计划方面表现有限，尤其在数字和物理推理任务中。

LLM + P框架结合了传统规划器的优点，能够通过自然语言描述解决规划问题，并提供大多数问题的最优解。

自主生成可执行计划的成功率仅约为3%。

通过结合传统规划器与LLMs，利用LLMs的常识推理能力，可以改善规划能力。

PLaG技术结合图形与自然语言提示，提升了模型性能，但在任务复杂性增加时仍存在局限性。

LLMs在自主规划方面表现非常有限，但在启发式模式下可以改善其他智能计划器的搜索过程。

🏷️