DifAttack: 通过分离的特征空间进行高效查询的黑盒攻击

💡 原文中文,约2300字,阅读约需6分钟。
📝

内容提要

DifAttack是一种新型黑盒对抗攻击方法,基于解耦特征空间,生成对抗实例并保持视觉特征不变。该方法在攻击成功率和查询效率上取得了显著的改进,尤其在有目标攻击和开放场景中。

🎯

关键要点

  • DifAttack是一种新型黑盒对抗攻击方法,基于解耦特征空间。
  • 该方法生成对抗实例并保持视觉特征不变。
  • DifAttack在攻击成功率和查询效率上取得显著改进。
  • 该方法特别适用于有目标攻击和开放场景。
  • DifAttack通过解耦图像的潜在特征来优化对抗特征。
  • 使用自编码器训练生成对抗实例,避免使用替代模型的梯度信息。
  • 大量实验结果表明,DifAttack在ASR和查询效率上优于现有方法。
➡️

继续阅读