关注中国少数民族语言模型的鲁棒性!
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种针对中国少数民族语言模型脆弱性的藏文音节级黑箱对抗攻击方法TSAttacker。实验结果表明,TSAttacker能够在六个模型上有效生成高质量的对抗样本,显示出模型的鲁棒性亟待提升。
🎯
关键要点
- 本研究提出了一种针对中国少数民族语言模型脆弱性的藏文音节级黑箱对抗攻击方法TSAttacker。
- TSAttacker基于音节余弦距离和评分机制。
- 实验结果显示,TSAttacker能够在六个模型上有效生成高质量的对抗样本。
- 研究表明当前模型的鲁棒性仍有很大提升空间。
➡️