小红花·文摘

本文提出了SpatialVLA模型，旨在解决机器人操作中的空间理解问题。通过引入Ego3D位置编码和自适应动作网格，提升机器人在多任务和新环境中的适应能力。实验结果表明，该模型在复杂动作轨迹推理和多任务学习方面表现优异。