本文介绍了PolarNet策略,使用3D点云进行语言引导的操纵任务。PolarNet通过点云输入、编码器和多模态变换器学习3D点云表示,并与语言指令集成以进行行动预测。在RLBench基准测试中,PolarNet在单任务和多任务学习中优于最先进的2D和3D方法,表现出高效和数据高效性。实际机器人上也取得了令人期待的结果。
完成下面两步后,将自动完成登录并继续当前操作。