微妙的图像扰动对定制扩散模型造成更高影响
原文中文,约300字,阅读约需1分钟。发表于: 。通过观察到交叉注意力层对梯度变化更加敏感,我们提出了一种简单但通用且高效的方法 CAAT,用于有效地欺骗潜在扩散模型 (LDMs)。我们展示了对图像的微小扰动可以显著影响交叉注意力层,从而在定制扩散模型的微调过程中改变文本与图像之间的映射关系。大量的实验证明,CAAT 与各种扩散模型兼容,并以更有效(更多的噪声)和更高效(比 Anti-DreamBooth 和 Mist 快两倍)的方式优于基线攻击方法。
该研究提出了Adv-Diffusion框架,生成逼真的对抗性图像。通过生成语义扰动的身份敏感条件扩散生成模型,设计了自适应强度的对抗性扰动算法。实验证明该方法在FFHQ和CelebA-HQ数据集上表现出卓越性能。