补丁足以:针对视觉语言预训练模型的自然对抗补丁

💡 原文中文,约1700字,阅读约需4分钟。
📝

内容提要

本研究针对视觉-语言预训练模型的鲁棒性问题,提出了协作多模态对抗攻击和CMI-Attack等新型对抗攻击方法,显著提高了对不同模型的攻击成功率。研究表明模态交互在增强对抗鲁棒性方面的重要性,为视觉-语言模型的安全部署提供了新视角。

🎯

关键要点

  • 本研究提出了协作多模态对抗攻击(Co-Attack)方法,旨在提高视觉-语言预训练模型的鲁棒性。

  • 研究发现现有方法在对抗性传递性方面表现较低,部分原因是对跨模态交互的利用不足。

  • 提出的集合级引导攻击(SGA)方法通过模态交互显著提高了对不同VLP模型的攻击成功率。

  • VLAttack框架结合单模态和多模态扰动,成功生成对抗样本,揭示了预训练模型部署中的重要盲点。

  • CMI-Attack方法利用模态交互机制,提升了图像-文本检索任务中的转移成功率。

  • 研究表明模态交互在增强对抗鲁棒性方面的重要性,为视觉-语言模型的安全部署提供了新视角。

  • 通过多模态对抗性示例的多样性扩展,改善了VLP模型的转移性。

  • SmoothVLM防御机制成功降低了视觉-语言模型中的补丁式对抗性提示注入的攻击率。

  • 提出的Contrastive-training Perturbation Generator方法在多模态任务中展现出卓越的攻击性能。

  • 联合多模态变换特征攻击(JMTFA)方法显著提高了对抗攻击成功率,揭示了文本模态对模型的影响。

延伸问答

什么是协作多模态对抗攻击(Co-Attack)?

协作多模态对抗攻击(Co-Attack)是一种新型攻击方法,旨在提高视觉-语言预训练模型的鲁棒性,增强对不同下游任务的攻击性能。

研究中提出的CMI-Attack方法有什么特点?

CMI-Attack利用模态交互机制,在保持语义不变的情况下,通过增强文本和图像的扰动约束,提高了图像-文本检索任务中的转移成功率。

如何提高视觉-语言预训练模型的对抗鲁棒性?

通过模态交互和多模态对抗性示例的多样性扩展,可以显著提高视觉-语言预训练模型的对抗鲁棒性。

SmoothVLM防御机制的作用是什么?

SmoothVLM防御机制旨在降低视觉-语言模型中的补丁式对抗性提示注入的攻击率,同时提高上下文恢复率。

集合级引导攻击(SGA)方法的优势是什么?

SGA方法通过充分利用模态交互,显著提高了对不同视觉-语言预训练模型的攻击成功率,提升了对抗性传递性。

联合多模态变换特征攻击(JMTFA)方法的主要贡献是什么?

JMTFA方法在白盒环境下同时针对视觉和文本模态引入对抗扰动,显著提高了对抗攻击的成功率,并揭示了文本模态对模型的影响。

➡️

继续阅读