原力灵机提出GeoVLA:让机器人看懂三维世界,打破2D视觉枷锁

量子位 量子位 ·

原力灵机的GeoVLA框架解决了VLA模型在非结构化环境中的空间失明问题,通过双流架构结合点云数据,提升了机器人的三维感知能力。实验表明,GeoVLA在复杂任务中的成功率显著高于传统2D模型,尤其在视角和物体尺寸变化时表现出强大的鲁棒性。

原文中文,约4700字,阅读约需12分钟。
阅读原文