NMT-混淆攻击:用一个词忽略翻译中的一句话

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新型对抗攻击方法,利用在句子间插入词的方式,使神经机器翻译模型忽略第二句,从而隐藏恶意信息。实验结果表明,超过50%的NMT模型对此攻击存在脆弱性。

🎯

关键要点

  • 本研究提出了一种新型对抗攻击方法,针对神经机器翻译(NMT)模型的脆弱性。
  • 通过在两个句子之间插入一个词,使得第二个句子在翻译中被忽略。
  • 这种方法能够在实践中隐藏恶意信息。
  • 实验结果显示,超过50%的NMT模型对这种攻击表现出脆弱性。
  • 攻击能够维持较低的困惑度。
➡️

继续阅读