从DeepMimic到带物理约束的MaskMimic——人形机器人全身运控的通用控制器：自此打通人类-动画-人形的训练路径

摘要：本文探讨了机器人动作模仿技术DeepMimic及其改进方案MaskMimic的发展历程。该技术通过结合深度强化学习和动作跟踪，实现了让虚拟角色和机器人模仿人类动作的能力。相比传统需要为每个动作单独设计控制器的做法，DeepMimic采用统一的神经网络架构和跟踪型奖励机制，只需提供参考动作即可生成对应控制策略。文章还介绍了该技术在宇树G1机器人上实现查尔斯顿舞的实际应用案例，以及从Dee...

本文介绍了DeepMimic和MaskMimic的研究，利用深度强化学习和动作跟踪技术，构建能够模仿人类动作的虚拟角色。DeepMimic通过统一奖励机制简化技能训练，而MaskMimic提升了模型的泛化能力，支持多任务和动态用户指令的交互，推动虚拟角色在复杂场景中的应用。

DeepMimic MaskMimic 动作跟踪控制器机器人深度强化学习虚拟角色