本研究提出超树规划(HTP),旨在解决大语言模型在复杂规划任务中的局限性,显著提升推理效率,在TravelPlanner基准测试中性能提升达3.6倍。
本研究分析了大型语言模型在自动形式规划任务中理解和生成规划领域定义语言(PDDL)的能力,发现尽管部分模型表现良好,但在复杂规划场景中仍存在局限性,为未来AI规划的发展提供了指导。
本研究提出了ChinaTravel基准,以更好地反映中国旅行规划需求。研究发现,神经符号智能体在旅行规划中的约束满足率为27.9%,显著高于纯神经模型的2.6%。这一成果凸显了ChinaTravel在复杂规划场景中的重要性。
完成下面两步后,将自动完成登录并继续当前操作。