本文提出了一种集成模型预测安全认证的新算法,结合了基于模型的深度强化学习和基于管道的模型预测控制,通过修正学习代理的行动来最小化安全约束违规。与其他强化学习方法相比,该算法能显著减少约束违规。
完成下面两步后,将自动完成登录并继续当前操作。