小红花·文摘 - 小红花技术领袖俱乐部

本研究提出超树规划（HTP），旨在解决大语言模型在复杂规划任务中的局限性，显著提升推理效率，在TravelPlanner基准测试中性能提升达3.6倍。

Hyper-Tree Planning: Enhancing Large Language Model Reasoning through Hierarchical Thinking

BriefGPT - AI 论文速递 ·

本研究分析了大型语言模型在自动形式规划任务中理解和生成规划领域定义语言（PDDL）的能力，发现尽管部分模型表现良好，但在复杂规划场景中仍存在局限性，为未来AI规划的发展提供了指导。

对现成大型语言模型在PDDL能力上的广泛评估

BriefGPT - AI 论文速递 ·

本研究提出了ChinaTravel基准，以更好地反映中国旅行规划需求。研究发现，神经符号智能体在旅行规划中的约束满足率为27.9%，显著高于纯神经模型的2.6%。这一成果凸显了ChinaTravel在复杂规划场景中的重要性。

ChinaTravel: A Real-World Benchmark for Language Agents in Chinese Travel Planning

BriefGPT - AI 论文速递 ·