AEIOU: 针对文本到图像模型中不安全提示的统一防御框架
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出AEIOU防御框架,针对文本到图像模型中的不安全提示问题,通过提取文本编码器隐状态中的不安全特征,显著提高检测准确性和效率,准确率超过95%。
🎯
关键要点
- 本研究提出AEIOU防御框架,针对文本到图像模型中的不安全提示问题。
- AEIOU框架通过提取文本编码器隐状态中的不安全特征,显著提高检测准确性和效率。
- AEIOU的准确率超过95%,能够实时解释结果。
- 该框架在各种架构中表现出色,具有良好的抗适应性攻击能力。
➡️