本文研究了参数高效微调(PEFT)机制在特洛伊攻击中的脆弱性。通过新的攻击方式PETA,即使在使用无污染数据对被植入后门的预训练语言模型(PLM)进行PEFT后,攻击仍然有效。研究还提出了一种简单的防御方法,即省略PEFT并解冻被植入后门的PLM的选定层,能够有效中和PETA。
本文提出了新的标准来评估子词符号化器中的词汇表示质量和词汇重叠度,发现跨语言单词表的重叠可能对某些下游任务产生负面影响,但在命名实体识别和句子级任务中分享词汇表是有益的。同时,多语种语言模型中特定语言标记的覆盖范围显著影响单词级任务。本文为未来的模型开发人员提供了选择最适合他们特定应用程序的符号化器的详细指导。
本文研究了PEFT机制在PLMs中的安全风险,提出了一种新的攻击方式PETA,并探索了一种简单的防御方法。研究表明,PETA攻击在各种下游任务和触发器设计上都有效,防御方法是在选定层中省略PEFT并解冻参数子集,能够有效中和PETA。
本文研究了PEFT机制在PLMs中的安全风险,提出了一种新的攻击方式PETA,并探索了一种简单的防御方法。研究表明,PETA攻击在各种下游任务和触发器设计上都很有效,但可以通过省略PEFT并解冻选定层的参数子集来中和。
完成下面两步后,将自动完成登录并继续当前操作。