补丁足以:针对视觉语言预训练模型的自然对抗补丁
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方法,通过图像补丁攻击视觉语言预训练模型,保持文本完整性,并用扩散模型增强扰动真实性。实验显示,该方法在图像对文本攻击中成功率达100%,在文本对图像任务中效果显著。
🎯
关键要点
- 本研究解决了视觉语言预训练模型在对抗攻击中的脆弱性问题。
- 提出了一种新颖的方法,使用图像补丁进行攻击,保持文本完整性。
- 利用扩散模型的先验知识增强扰动的真实性和自然性。
- 实验结果显示,该方法在图像对文本场景下的攻击成功率达100%。
- 在文本对图像的转移任务中,该方法表现优异。
➡️