本文探讨了文本引导生成模型的后门攻击,提出了BadT2I攻击框架和T2IShield防御方法,评估了模型的鲁棒性,并展示了后门检测和定位的有效性。实验结果表明,后门攻击可通过少量恶意数据激活,强调了防御策略的重要性。
完成下面两步后,将自动完成登录并继续当前操作。