本文提出了ViPlan基准,旨在比较符号规划与视觉语言模型(VLM)在视觉规划中的表现。研究评估了九个开源VLM模型,结果显示符号规划在某些任务中优于VLM,而在其他任务中则相反,揭示了该领域的复杂性和模型的局限性。
本研究提出了一种新方法AdaWorld,旨在解决世界模型在新环境适应时对大量标签数据的依赖问题。实验结果表明,该方法在仿真质量和视觉规划方面表现优越,具有重要的应用潜力。
本研究提出了一种离散层次规划(DHP)方法,有效解决了长时间视觉规划任务中的挑战,显著提升了复杂环境中的规划效率和成功率。
我们提出了一种机器人学习方法,解决了视频规划中的任务沟通、可控视频生成和视觉规划转化为机器人动作等挑战。通过语言手势调节生成视频,简化了复杂环境中的任务执行,展示了其在通用任务规划中的有效性。
完成下面两步后,将自动完成登录并继续当前操作。