低秩对抗PGD攻击
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究提出了一种名为sparse-PGD的白盒攻击方法,用于在$l_0$范数约束下生成稀疏对抗扰动。结合黑盒攻击评估模型鲁棒性,并用于对抗性训练提升模型抗扰能力。实验显示,sparse-PGD在不同场景中表现出色,训练的模型对稀疏攻击具有最新鲁棒性。
🎯
关键要点
- 提出了一种名为sparse-PGD的白盒攻击方法,用于生成稀疏对抗扰动。
- sparse-PGD结合黑盒攻击评估模型在$l_0$约束下的鲁棒性。
- sparse-PGD的高效性支持对抗性训练,提升模型对稀疏扰动的鲁棒性。
- 实验结果显示,sparse-PGD在不同场景中表现出色。
- 对抗训练模型相比其他鲁棒模型,展示了对各种稀疏攻击的最新鲁棒性。
🏷️
标签
➡️