本文提出了ViPlan基准,旨在比较符号规划与视觉语言模型(VLM)在视觉规划中的表现。研究评估了九个开源VLM模型,结果显示符号规划在某些任务中优于VLM,而在其他任务中则相反,揭示了该领域的复杂性和模型的局限性。
本研究探讨了在复杂长期决策任务中结合符号规划与变换器策略。通过构建高层符号规划器和低层决策变换器,该框架在不确定的高维环境中生成有效的行动序列,实验结果表明其成功率和策略效率优于纯神经网络方法。
本研究提出了一种新颖的归纳模仿学习框架(ABIL),旨在解决现有模仿学习在开放环境中处理长时间任务的不足。ABIL结合数据驱动学习与符号推理,展现出在长时间任务中的数据效率和泛化能力,为符号规划提供了新思路。
本文介绍了多种创新的规划方法,如CPEM、Egocentric Planning和PALMER,旨在提高复杂环境中的任务成功率。研究结合符号规划与学习感知,展示了在家庭任务和长视距规划中的显著进展。此外,DeepEMplanner框架和多模态语言模型的应用提升了任务规划的性能,推动了机器人技术的发展。
完成下面两步后,将自动完成登录并继续当前操作。