小红花·文摘

本文提出了一种集成模型预测安全认证的新算法，结合了基于模型的深度强化学习和基于管道的模型预测控制，通过修正学习代理的行动来最小化安全约束违规。与其他强化学习方法相比，该算法能显著减少约束违规。