我们提出了一种改进机器人能力感知的方法,通过精确、可操作的能力表示、视觉与语言模型的连接以及人机协同,机器人能够搜索并实现目标。实证研究中,我们查找不同类型的门及其打开方式的场景。
完成下面两步后,将自动完成登录并继续当前操作。