该文介绍了一种基于强化学习的端到端方法,用于实现(e)NMPC应用中的动态代理模型最优性能。该方法在两个应用中验证,表现相当于无模型神经网络控制器,始终优于基于系统识别的模型。
完成下面两步后,将自动完成登录并继续当前操作。