本文介绍了一个可解释且通用的视觉规划框架,包括基于替代的概念学习器(SCL)和视觉因果转换模型(ViCT)。通过学习符号抽象和推理的任务规划,以及将视觉因果转换与语义相似的现实世界行为联系起来,实现目标状态。作者通过在AI2-THOR基础上收集大型视觉规划数据集(CCTP)进行实验,展示了该方法在视觉任务规划中的卓越性能,并证明了框架的推广能力。
该文介绍了一个可解释且具有通用性的视觉规划框架,其中包括一种新颖的基于替代的概念学习器(SCL)和视觉因果转换模型(ViCT)。作者在 AI2-THOR 基础上收集了一个大型视觉规划数据集(CCTP),并在这个具有挑战性的数据集上进行了大量实验,展示了该方法在视觉任务规划中的卓越性能。
完成下面两步后,将自动完成登录并继续当前操作。