本文提出了一个利用扩散模型潜在空间中的语义信息快速生成语义对抗攻击的框架,并在 CelebA-HQ 和 AFHQ 数据集上进行了实验,最佳 FID 为 36.61。
该论文提出了一种基于语义对抗攻击的方法SIA,通过在预定义的语义属性空间和图像空间上的迭代梯度上升来结合语义追踪和感知质量,解释和分析模型缺陷。该方法在模型诊断、攻击成功率和不平衡数据鲁棒性方面具有应用前景。
完成下面两步后,将自动完成登录并继续当前操作。