本文提出了一种深度残差模型预测控制(DR-MPC)方法,旨在帮助机器人安全高效地在复杂人群中导航。DR-MPC结合了模型预测控制(MPC)与无模型深度强化学习(DRL),有效克服了传统DRL在数据需求和初始行为安全性方面的不足。实验结果表明,DR-MPC在模拟和现实环境中表现优异,能够在少于4小时的训练数据下应对各种拥挤情况。
完成下面两步后,将自动完成登录并继续当前操作。