本研究解决了现代3D视频游戏中模仿学习的环境复杂性问题。通过逆动力学模型和未来对齐策略,展示了在多样化数据环境中训练的策略头能够有效跟随轨迹,且模型配置依赖于具体设置。
研究人员提出了一种新的损失函数,用于改善机械手逆动力学的控制性能。实验结果显示该方法比传统方法更准确,并在死区中的模型行为得到验证和讨论。
完成下面两步后,将自动完成登录并继续当前操作。