Safe + Safe = Unsafe? Exploring How Safe Images Can Be Exploited to Jailbreak Large Vision-Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨大型视觉语言模型(LVLMs)在安全性方面的不足,提出了安全雪球代理(SSA)框架,通过安全图像和提示诱导模型生成不安全内容,以挑战多模态系统的安全性。
🎯
关键要点
- 本研究探讨大型视觉语言模型(LVLMs)在安全性方面的不足。
- 提出了安全雪球代理(SSA)框架,利用安全图像和提示诱导模型生成不安全内容。
- 实验表明,该方法能够成功诱导LVLMs产生不安全内容,挑战多模态系统的安全性。
➡️