OrderBkd: 文字背门攻击的重新定位
原文中文,约200字,阅读约需1分钟。发表于: 。借助特定词语在句子中的重新定位作为触发器,设计和应用基于词性标注的规则来选择这些词汇,在保持高攻击成功率的同时,优于现有攻击的困惑度和与清洁样本的语义相似性。
本文研究了文本后门攻击对NLP系统的威胁,并提出了评估协议和开源工具包OpenBackdoor。文章探讨了攻击和防御模型的性能,并提出了聚类-based的防御策略CUBE。
借助特定词语在句子中的重新定位作为触发器,设计和应用基于词性标注的规则来选择这些词汇,在保持高攻击成功率的同时,优于现有攻击的困惑度和与清洁样本的语义相似性。
本文研究了文本后门攻击对NLP系统的威胁,并提出了评估协议和开源工具包OpenBackdoor。文章探讨了攻击和防御模型的性能,并提出了聚类-based的防御策略CUBE。