量子位 ·

机器人感知大升级！轻量化注入几何先验，成功率提升31%

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

Evo-0模型通过隐式注入3D几何先验，提升机器人对三维空间的理解，成功率提高31%。该方法无需额外传感器，利用VGGT提取3D信息，显著增强空间感知，训练效率高，适用于多种机器人任务。

🎯

🔎

Evo-0模型通过隐式注入3D几何先验，解决了传统模型对3D空间理解不足的问题。与依赖额外传感器的方案相比，Evo-0不仅降低了部署难度，还提高了训练效率，显示出在复杂任务中的优越性。

Evo-0在多种干扰条件下表现出色，证明了其鲁棒性。这意味着在实际应用中，Evo-0能够更好地应对环境变化，适应不同的操作场景，提升了机器人在真实世界中的实用性。

Evo-0仅需15k步训练便能超越20k步训练的基线模型，显示出其高效的学习能力。这一特性使得Evo-0在资源有限的情况下，仍能快速达到较高的性能水平，适合快速迭代的开发环境。

❓

Evo-0模型通过隐式注入3D几何先验，利用VGGT提取3D信息，显著增强机器人对三维空间的理解能力。

Evo-0模型仅需15k步训练即可超过20k步训练的π0，显示出更高的训练效率。

Evo-0在真实机器人任务中，平均成功率提升28.88%，尤其在复杂空间关系任务中表现优异。

Evo-0在多种干扰条件下表现出色，优于基准模型pi0，显示出良好的鲁棒性。

Evo-0的核心创新在于将VGGT作为空间编码器，引入t3^D token，实现2D–3D表征的融合。

在rlbench仿真实验中，Evo-0在5个任务上平均成功率超过基线pi0 15%。

🏷️