小红花·文摘

本研究提出了UNIDOOR，一个通用的动作级后门攻击框架，旨在解决深度强化学习中的后门攻击问题。UNIDOOR通过自适应探索后门奖励函数，显著提升了攻击效果，展示了其在多种攻击场景下的优越性能和广泛适用性。