补丁足以:针对视觉语言预训练模型的自然对抗补丁

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种新方法,通过图像补丁攻击视觉语言预训练模型,保持文本完整性,并用扩散模型增强扰动真实性。实验显示,该方法在图像对文本攻击中成功率达100%,在文本对图像任务中效果显著。

🎯

关键要点

  • 本研究解决了视觉语言预训练模型在对抗攻击中的脆弱性问题。
  • 提出了一种新颖的方法,使用图像补丁进行攻击,保持文本完整性。
  • 利用扩散模型的先验知识增强扰动的真实性和自然性。
  • 实验结果显示,该方法在图像对文本场景下的攻击成功率达100%。
  • 在文本对图像的转移任务中,该方法表现优异。
➡️

继续阅读