小红花·文摘

本文研究基于AI2-THOR框架的物体操作，提出ArmPointNav挑战，涉及3D障碍物避免和多物体操作。研究表明，手心视角提升训练效率，软硬注意机制增强机器人操控能力。通过视觉-语言模型开发的MOO方法，实现自然语言指令的目标提取，并在真实环境中展现良好的泛化能力。

BriefGPT - AI 论文速递 ·

该文介绍了一个可解释且具有通用性的视觉规划框架，其中包括一种新颖的基于替代的概念学习器（SCL）和视觉因果转换模型（ViCT）。作者在 AI2-THOR 基础上收集了一个大型视觉规划数据集（CCTP），并在这个具有挑战性的数据集上进行了大量实验，展示了该方法在视觉任务规划中的卓越性能。

BriefGPT - AI 论文速递 ·