CL-攻击:通过跨语言触发器进行文本后门攻击
📝
内容提要
本研究针对当前文本后门攻击方法存在的识别困难与语义偏移问题,提出了一种新的跨语言触发器方法CL-攻击。其创新之处在于通过特定结构的多语言文本在段落层面注入后门,实现了更高的隐蔽性和普适性。实验结果表明,CL-攻击在分类和生成任务中均可达到近100%的成功率,同时对当前的防御方法具有更强的鲁棒性。
🏷️
标签
➡️