AdvI2I:针对图像到图像扩散模型的对抗图像攻击

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文探讨了文本到图像(T2I)模型的安全性,特别关注“隐式对抗”提示。研究团队通过Adversarial Nibbler Challenge收集了超过10,000个提示-图像对,发现14%的有害图像被误标为“安全”。强调了持续审核和适应性的重要性,以增强T2I模型的鲁棒性。

原文中文,约600字,阅读约需2分钟。
阅读原文