学习基于概念的视觉因果转换和符号推理用于视觉规划
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文介绍了一个可解释且具有通用性的视觉规划框架,其中包括一种新颖的基于替代的概念学习器(SCL)和视觉因果转换模型(ViCT)。作者在 AI2-THOR 基础上收集了一个大型视觉规划数据集(CCTP),并在这个具有挑战性的数据集上进行了大量实验,展示了该方法在视觉任务规划中的卓越性能。
🎯
关键要点
- 提出了一个可解释且具有通用性的视觉规划框架。
- 框架包括基于替代的概念学习器(SCL)和视觉因果转换模型(ViCT)。
- SCL 通过学习符号抽象和推理进行任务规划。
- ViCT 将视觉因果转换与现实世界行为的语义相似性联系起来。
- 在 AI2-THOR 基础上收集了大型视觉规划数据集(CCTP)。
- 在 CCTP 数据集上进行了大量实验,展示了方法的卓越性能。
- 框架能够推广到未见过的任务轨迹和物体类别。
➡️