CERT-ED: 编辑距离下的可验证健壮文本分类
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究人员提出了一种适用于自然语言分类的保护方法CERT-ED,通过随机删除的方式进行实验。实验证明,CERT-ED在准确性和证书的基数方面优于现有的海明距离方法RanMASK。在各种威胁模型下,CERT-ED提高了实验鲁棒性。
🎯
关键要点
- 研究人员提出了一种适用于自然语言分类的保护方法CERT-ED。
- CERT-ED通过随机删除的方式进行实验。
- 实验证明,CERT-ED在准确性和证书的基数方面优于现有的海明距离方法RanMASK。
- 在包括5个直接攻击和5个迁移攻击的各种威胁模型下,CERT-ED提高了实验鲁棒性。
- 在50个设置中,CERT-ED提高了38个实验的鲁棒性。
➡️