Deceiving Question-Answering Models: A Hybrid Word-Level Adversarial Approach
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新颖的词级对抗策略QA-Attack,通过同义词替换来误导问答模型,显著提高了对抗攻击的成功率。
🎯
关键要点
- 本研究聚焦于问答模型在对抗攻击下的脆弱性。
- 提出了一种新颖的词级对抗策略QA-Attack。
- QA-Attack利用定制的注意力机制和删除排序策略。
- 通过同义词替换来误导问答模型,保持语法完整性。
- 实验证明该方法在多种问答类型中表现出色。
- 显著提升了对现有对抗技术的成功率。
➡️