NMT-混淆攻击:用一个词忽略翻译中的一句话
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新型对抗攻击方法,利用在句子间插入词的方式,使神经机器翻译模型忽略第二句,从而隐藏恶意信息。实验结果表明,超过50%的NMT模型对此攻击存在脆弱性。
🎯
关键要点
- 本研究提出了一种新型对抗攻击方法,针对神经机器翻译(NMT)模型的脆弱性。
- 通过在两个句子之间插入一个词,使得第二个句子在翻译中被忽略。
- 这种方法能够在实践中隐藏恶意信息。
- 实验结果显示,超过50%的NMT模型对这种攻击表现出脆弱性。
- 攻击能够维持较低的困惑度。
➡️