AEIOU: A Unified Defense Framework Against Unsafe Prompts in Text-to-Image Models

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出AEIOU框架,旨在解决文本到图像模型中的不安全提示问题。该框架通过提取文本编码器的隐状态特征,能够高效检测不安全提示,准确率超过95%。AEIOU在多种架构中表现优异,具备良好的抗适应性攻击能力。

🎯

关键要点

  • AEIOU框架旨在解决文本到图像模型中的不安全提示问题。

  • 该框架通过提取文本编码器的隐状态特征,能够高效检测不安全提示。

  • AEIOU的检测准确率超过95%。

  • 该框架在多种架构中表现优异,具备良好的抗适应性攻击能力。

  • AEIOU显著提高了检测效率,并能够实时解释结果。

🏷️

标签

➡️

继续阅读