应用动作空间中自适应对抗扰动的鲁棒深度强化学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了深度强化学习算法中的建模错误问题,并提出了一种自适应对抗性扰动的方法来提高鲁棒性。实验结果表明,该方法可以提高训练的稳定性,并在不同的测试环境中学习到一种鲁棒的策略。