BackdoorBench: 一个综合的后门学习基准和分析
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文研究了文本后门攻击对NLP系统的威胁,并提出了评估协议和开源工具包OpenBackdoor。文章讨论了攻击和防御模型的性能,并提出了聚类-based的防御策略CUBE。
🎯
关键要点
-
研究了文本后门攻击对NLP系统的威胁
-
提出了特定的评估协议以解决真实环境差异问题
-
开发了开源工具包OpenBackdoor以促进文本后门学习的实现和评估
-
详细探讨了攻击和防御模型的性能
-
提出了聚类-based的防御策略CUBE
🏷️
标签
➡️