本研究开发了一个基于大型变换器模型的策略Octo,通过预训练泛化策略,可在几小时内对新传感输入和行为空间进行有效微调。这为机器人操控领域的泛化机器人模型研究提供了经验指导。
完成下面两步后,将自动完成登录并继续当前操作。