本文探讨了大型语言模型的后门攻击脆弱性,提出了组合后门攻击(CBA)和新型后门攻击方法POISONPROMPT,强调安全性研究的重要性。研究表明,后门攻击在多种任务中有效,并提出了防御机制以降低攻击成功率。
完成下面两步后,将自动完成登录并继续当前操作。