本研究提出了UNIDOOR,一个通用的动作级后门攻击框架,旨在解决深度强化学习中的后门攻击问题。UNIDOOR通过自适应探索后门奖励函数,显著提升了攻击效果,展示了其在多种攻击场景下的优越性能和广泛适用性。
完成下面两步后,将自动完成登录并继续当前操作。