本文介绍了HDMI(人类模仿交互)框架,该框架通过RGB视频学习人类与物体的交互技能,并利用强化学习训练人形机器人实现复杂的全身交互能力。研究表明HDMI在真实世界任务中表现出良好的稳健性和灵活性,尤其在行走与物体交互方面。尽管取得了进展,HDMI仍依赖于动作捕捉数据,未来需开发基于传感器的自主学习策略。
完成下面两步后,将自动完成登录并继续当前操作。