小红花·文摘

本文探讨了文本引导生成模型的后门攻击，提出了BadT2I攻击框架和T2IShield防御方法，评估了模型的鲁棒性，并展示了后门检测和定位的有效性。实验结果表明，后门攻击可通过少量恶意数据激活，强调了防御策略的重要性。