本研究提出了一种新方法LMAffordance3D,通过语言指令、视觉观察和交互来定位3D空间中的可操控物体,成功连接感知与行动。实验结果表明该方法在复杂场景中表现优越。
完成下面两步后,将自动完成登录并继续当前操作。