本研究针对自然语言处理系统的脆弱性,提出了一种基于链关联的对抗攻击方法,利用了人类与机器之间的理解差距。通过生成汉字的链关联图并应用粒子群优化算法,我们发现高级自然语言处理模型对这种攻击敏感,而人类则能够良好理解受到干扰的文本。同时,我们探讨了对抗训练和基于关联图的恢复两种防护方法,以提高系统的安全性。
本研究提出了一种基于链关联的对抗攻击方法,揭示了自然语言处理系统的脆弱性。通过生成汉字链关联图并应用粒子群优化算法,发现高级模型对攻击敏感,而人类的理解能力较强。同时,探讨了对抗训练和恢复方法以增强系统的安全性。