AEIOU: A Unified Defense Framework Against Unsafe Prompts in Text-to-Image Models
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出AEIOU框架,旨在解决文本到图像模型中的不安全提示问题。该框架通过提取文本编码器的隐状态特征,能够高效检测不安全提示,准确率超过95%。AEIOU在多种架构中表现优异,具备良好的抗适应性攻击能力。
🎯
关键要点
-
AEIOU框架旨在解决文本到图像模型中的不安全提示问题。
-
该框架通过提取文本编码器的隐状态特征,能够高效检测不安全提示。
-
AEIOU的检测准确率超过95%。
-
该框架在多种架构中表现优异,具备良好的抗适应性攻击能力。
-
AEIOU显著提高了检测效率,并能够实时解释结果。
🏷️