情感攻击:通过表情符号序列对自然语言处理系统进行零扰动对抗攻击
📝
内容提要
本研究针对自然语言处理(NLP)系统易受对抗攻击的脆弱性,提出了一种新的攻击方法——情感攻击(Emoji-Attack),该方法通过操控表情符号实现细微、有效的扰动。与传统的连续字符或单词级策略不同,情感攻击以表情符号为攻击层次,能够产生不易察觉的变化,从而显著提高对抗攻击的有效性和NLP系统的稳健性。
🏷️
标签
➡️