针对合作多智能体深度强化学习的时空隐秘后门攻击
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对合作多智能体深度强化学习(c-MADRL)中存在的后门攻击问题,提出了一种新型时空隐秘后门攻击方法。该方法通过在单个智能体中嵌入攻击触发,利用对抗时空行为模式作为后门触发器,并逆向调整奖励函数,以确保对整个团队的负面影响。实验结果显示,该攻击方法成功率高达91.6%,而干净性能方差率仅为3.7%。
该研究论文探讨了分散式增强学习场景中的合作后门攻击方法,通过隐藏后门行为并与良性代理共享策略,成功地向良性代理的增强学习策略中注入后门攻击。该方法隐蔽且难以检测,实验证明了其效率和隐蔽性。这是首次提出的可证明的分散式增强学习中的合作后门攻击。