原力灵机提出GeoVLA：让机器人看懂三维世界，打破2D视觉枷锁

量子位 ·

原力灵机的GeoVLA框架解决了VLA模型在非结构化环境中的空间失明问题，通过双流架构结合点云数据，提升了机器人的三维感知能力。实验表明，GeoVLA在复杂任务中的成功率显著高于传统2D模型，尤其在视角和物体尺寸变化时表现出强大的鲁棒性。

GeoVLA VLA模型三维感知机器人点云数据鲁棒性

原文中文，约4700字，阅读约需12分钟。