本研究提出了一种自适应梯度遮罩强化(AGMR)攻击方法,旨在解决深度强化学习在机器人控制中的脆弱性。AGMR通过动态识别关键状态和优化对抗策略,显著提高了对抗攻击的有效性和受害者代理的鲁棒性,实验结果表明其优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。