ViSA-Flow:通过大规模视频语义动作流加速机器人技能学习
📝
内容提要
本研究解决了机器人学习复杂操作技能所面临的高成本问题,通过引入语义动作流作为关键中介表示,捕捉关键的时空操作物体交互。ViSA-Flow框架自我监督地从无标记的大规模视频数据中学习该表示,实验表明其在低数据环境中表现优异,实现了人类视频观察知识向机器人执行的有效迁移。
🏷️
标签
➡️