NMT Obfuscation Attack: Ignoring a Sentence in Translation with One Word

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新型对抗攻击方法,针对神经机器翻译(NMT)模型。通过在句子间插入一个词,研究者能够使第二个句子在翻译中被忽略,从而隐藏恶意信息。实验结果显示,超过50%的NMT模型对这种攻击表现出脆弱性。

🎯

关键要点

  • 本研究提出了一种新型对抗攻击方法,针对神经机器翻译(NMT)模型。
  • 通过在两个句子之间插入一个词,研究者能够使第二个句子在翻译中被忽略。
  • 这种方法可以有效隐藏恶意信息。
  • 实验结果显示,超过50%的NMT模型对这种攻击表现出脆弱性。
  • 该攻击方法能够维持较低的困惑度。
➡️

继续阅读