Groot:基于树状语义转换的生成式文本转图像模型的对抗性测试
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
文本条件的图像生成模型在图像质量和对齐性方面取得了惊人的结果,但依赖于大量数据集,可能生成不安全内容。通过对收集到的提示和图像进行分析,揭示了输入过滤器的脆弱性和生成图像模型中的系统安全问题。
🎯
关键要点
- 文本条件的图像生成模型在图像质量和对齐性方面取得了惊人的结果。
- 这些模型依赖于从网络随机获取的大量数据集,可能生成不安全的内容。
- 作为对 Adversarial Nibbler 挑战的贡献,提取了超过 1,000 个潜在对抗性输入。
- 通过分析收集到的提示和相应的图像,揭示了输入过滤器的脆弱性。
- 深入研究了当前生成图像模型中的系统安全问题。
➡️