Helix——Figure 02上的通用人形VLA:不用微调即可做多个任务的快与慢双系统,让两个机器人协作干活(含清华HiRT详解)
💡
原文中文,约3800字,阅读约需9分钟。
📝
内容提要
Helix是首款高速控制的人形机器人,能够灵活应对复杂家庭场景。通过结合快慢系统,Helix实现高效的视觉语言理解与动作执行,支持自然语言指令,提升操作的泛化能力和效率。
🎯
关键要点
- Helix是首款高速控制的人形机器人,能够灵活应对复杂家庭场景。
- Helix结合快慢系统,实现高效的视觉语言理解与动作执行。
- Helix支持自然语言指令,提升操作的泛化能力和效率。
- Helix是第一个对整个人形上身进行高速率连续控制的VLA。
- Helix能够在两个机器人上同时运行,解决共享的远程操作任务。
- Helix配备的机器人可以根据自然语言提示拿起几乎任何小型家居物品。
- Helix使用一组神经网络权重学习所有行为,无需针对特定任务的微调。
- Helix通过组合快系统和慢系统,解决了VLM主干速度与通用性之间的权衡。
- Helix的系统1和系统2分别负责快速推理和深度思考,协同工作。
- Helix的操作频率达到200Hz,显著高于其他模型如π0和RT-2。
- Helix的训练数据集包含约500小时的多机器人、多操作员数据。
- Helix经过完全端到端的训练,无需针对特定任务的调整。
- Helix的推理管道分为S2(高级潜在规划)和S1(低级控制),支持高效并行部署。
➡️