小红花·文摘

本研究开发了一个基于大型变换器模型的策略Octo，通过预训练泛化策略，可在几小时内对新传感输入和行为空间进行有效微调。这为机器人操控领域的泛化机器人模型研究提供了经验指导。