本研究针对视觉-语言预训练模型的鲁棒性问题,提出了协作多模态对抗攻击和CMI-Attack等新型对抗攻击方法,显著提高了对不同模型的攻击成功率。研究表明模态交互在增强对抗鲁棒性方面的重要性,为视觉-语言模型的安全部署提供了新视角。
本文研究了视觉语言预训练模型(VLP)的对抗性,提出了集合级引导攻击(SGA)和协作多模态对抗攻击(Co-Attack)等新型攻击方法,显著提高了攻击成功率。实验结果表明,模态交互在增强对抗鲁棒性方面至关重要,揭示了VLP模型的脆弱性及其在实际应用中的安全隐患。
完成下面两步后,将自动完成登录并继续当前操作。