Metaphor-based Jailbreaking Attacks on Text-to-Image Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种基于隐喻的越狱攻击方法MJA,旨在解决文本到图像模型的安全漏洞。MJA通过生成隐喻式对抗提示,提高了攻击效果和查询效率,实验结果显示其在多种模型上表现良好。
🎯
关键要点
- 本研究提出了一种基于隐喻的越狱攻击方法MJA,旨在解决文本到图像模型的安全漏洞。
- 现有的攻击方法依赖大量查询,降低了其实用性。
- MJA通过生成隐喻式对抗提示,显著提高了攻击效果和查询效率。
- 实验结果显示MJA在多种文本到图像模型上表现出良好的转移性。
➡️