NMT Obfuscation Attack: Ignoring a Sentence in Translation with One Word
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新型对抗攻击方法,针对神经机器翻译(NMT)模型。通过在句子间插入一个词,研究者能够使第二个句子在翻译中被忽略,从而隐藏恶意信息。实验结果显示,超过50%的NMT模型对这种攻击表现出脆弱性。
🎯
关键要点
- 本研究提出了一种新型对抗攻击方法,针对神经机器翻译(NMT)模型。
- 通过在两个句子之间插入一个词,研究者能够使第二个句子在翻译中被忽略。
- 这种方法可以有效隐藏恶意信息。
- 实验结果显示,超过50%的NMT模型对这种攻击表现出脆弱性。
- 该攻击方法能够维持较低的困惑度。
➡️