AEIOU: 针对文本到图像模型中不安全提示的统一防御框架

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出AEIOU防御框架,针对文本到图像模型中的不安全提示问题,通过提取文本编码器隐状态中的不安全特征,显著提高检测准确性和效率,准确率超过95%。

🎯

关键要点

  • 本研究提出AEIOU防御框架,针对文本到图像模型中的不安全提示问题。
  • AEIOU框架通过提取文本编码器隐状态中的不安全特征,显著提高检测准确性和效率。
  • AEIOU的准确率超过95%,能够实时解释结果。
  • 该框架在各种架构中表现出色,具有良好的抗适应性攻击能力。
➡️

继续阅读