小红花·文摘

本研究提出了一种新方法LMAffordance3D，通过语言指令、视觉观察和交互来定位3D空间中的可操控物体，成功连接感知与行动。实验结果表明该方法在复杂场景中表现优越。