妆容攻击:通过妆容转移对人脸识别进行特征空间黑箱后门攻击

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

深度神经网络在面部伪造检测中性能提高,但受到后门攻击威胁。研究了自然触发器,提出了基于合成分析的后门攻击方法。实验证明该方法在攻击成功率、后门防御和人工检查方面具有优势。

🎯

关键要点

  • 深度神经网络在面部伪造检测中性能显著提高,但面临后门攻击威胁。
  • 提出了一种基于合成分析的后门攻击方法,研究自然触发器的嵌入潜在空间。
  • 从模型区分和数据分布两个角度深入研究后门漏洞。
  • 使用优化的触发器最小化交叉熵损失找到触发器。
  • 通过操纵长尾分布生成没有检测模型监督的污染样本。
  • 采用StyleGAN和Stable Diffusion评估触发器生成的人工智能内容。
  • 后门触发器引入特定语义特征,使生成样本更自然、更健壮。
  • 实验证明该方法在攻击成功率、后门防御和人工检查方面具有优越性。
  • 攻击成功率超过99%,低污染率下模型准确性下降小于0.2%。
  • 在面对现有后门防御方法时显示出更好的鲁棒性。
  • 综合用户研究表明该方法对人视觉更不敏感。
➡️

继续阅读