小红花·文摘

本研究提出了一种新的方法来解决干扰图像检测的任务，通过利用大型多模型模型中编码的知识，提取通用语义描述和引发的情感，并利用 CLIP 的文本编码器获取文本嵌入。最终，将这些文本嵌入与相应的 CLIP 图像嵌入一起用于干扰图像检测任务，提高了分类准确度。

BriefGPT - AI 论文速递 ·

我们使用新的视觉提示攻击方法成功攻击了开源的大型多模型模型，即使采用了安全对齐的大型语言模型，我们的方法也能轻松攻击。我们评估了12种先进的多模型模型在13种情景中的弱点，发现了其脆弱性，加强了我们对加强安全措施的需求。

BriefGPT - AI 论文速递 ·