本文探讨了文本到图像(T2I)模型的安全性,特别关注“隐式对抗”提示。研究团队通过Adversarial Nibbler Challenge收集了超过10,000个提示-图像对,发现14%的有害图像被误标为“安全”。强调了持续审核和适应性的重要性,以增强T2I模型的鲁棒性。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: