小红花·文摘

本研究提出了一种自适应梯度遮罩强化（AGMR）攻击方法，旨在解决深度强化学习在机器人控制中的脆弱性。AGMR通过动态识别关键状态和优化对抗策略，显著提高了对抗攻击的有效性和受害者代理的鲁棒性，实验结果表明其优于现有方法。