朝向隐形后门攻击的文本到图像扩散模型

📝

内容提要

本研究解决了现有文本到图像扩散模型中后门攻击样本存在的语义一致性和注意力一致性问题。我们提出了一种新的隐形后门攻击方法,通过利用句法结构作为触发器来削弱语义一致性,同时采用基于内核最大均值差异(KMMD)的正则化方法来破坏注意力一致性。实验表明,我们的隐形后门攻击方法达到了97.5%的成功率,并且对三种最先进的检测机制表现出更强的抗击能力。

🏷️

标签

➡️

继续阅读