本文提出了SpatialVLA模型,旨在解决机器人操作中的空间理解问题。通过引入Ego3D位置编码和自适应动作网格,提升机器人在多任务和新环境中的适应能力。实验结果表明,该模型在复杂动作轨迹推理和多任务学习方面表现优异。
完成下面两步后,将自动完成登录并继续当前操作。