BackdoorBench: 一个综合的后门学习基准和分析

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文研究了文本后门攻击对NLP系统的威胁,并提出了评估协议和开源工具包OpenBackdoor。文章讨论了攻击和防御模型的性能,并提出了聚类-based的防御策略CUBE。

🎯

关键要点

  • 研究了文本后门攻击对NLP系统的威胁

  • 提出了特定的评估协议以解决真实环境差异问题

  • 开发了开源工具包OpenBackdoor以促进文本后门学习的实现和评估

  • 详细探讨了攻击和防御模型的性能

  • 提出了聚类-based的防御策略CUBE

➡️

继续阅读