本研究提出了一种利用人类视频数据进行语言基础推理的方法,以应对机器人在新环境中的泛化挑战。该方法结合机器人演示数据和无动作标签的人类视频数据,成功训练出跨越人类与机器人行为差距的泛化策略,实验结果表明在新任务上的表现显著提升。
完成下面两步后,将自动完成登录并继续当前操作。