LEAP: 自然语言处理软件的高效自动化测试方法
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文通过强化学习生成对抗性样本,研究了神经机器翻译系统的失败情况,对RNN-search和Transformer进行了敌对攻击实验,结果表明该方法能够有效生成稳定的攻击和有保留含义的对抗性样本,并展示了攻击偏好模式的定性和定量分析,证明了该方法能够暴露神经翻译系统的缺陷。
🎯
关键要点
- 通过强化学习生成对抗性样本,研究神经机器翻译系统的失败情况。
- 对RNN-search和Transformer进行了敌对攻击实验。
- 该方法能够有效生成稳定的攻击和有保留含义的对抗性样本。
- 展示了攻击偏好模式的定性和定量分析。
- 证明了该方法能够暴露神经翻译系统的缺陷。
➡️