DifAttack: 通过分离的特征空间进行高效查询的黑盒攻击
💡
原文中文,约2300字,阅读约需6分钟。
📝
内容提要
DifAttack是一种新型黑盒对抗攻击方法,基于解耦特征空间,生成对抗实例并保持视觉特征不变。该方法在攻击成功率和查询效率上取得了显著的改进,尤其在有目标攻击和开放场景中。
🎯
关键要点
- DifAttack是一种新型黑盒对抗攻击方法,基于解耦特征空间。
- 该方法生成对抗实例并保持视觉特征不变。
- DifAttack在攻击成功率和查询效率上取得显著改进。
- 该方法特别适用于有目标攻击和开放场景。
- DifAttack通过解耦图像的潜在特征来优化对抗特征。
- 使用自编码器训练生成对抗实例,避免使用替代模型的梯度信息。
- 大量实验结果表明,DifAttack在ASR和查询效率上优于现有方法。
➡️