攻击基准:对于对抗性样本的基于梯度的攻击评估

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

AttackBench是一个公平比较框架,用于评估对抗样本优化的攻击。实证分析发现只有少数攻击能够超越其他竞争方法,并揭示了一些实现问题。AttackBench作为一个公开可用的基准,并不断更新以包含和评估新的梯度攻击方法。

🎯

关键要点

  • AttackBench是一个公平比较框架,用于评估对抗样本优化的攻击。
  • 通过分类梯度攻击、定义优化度量标准和限制查询次数等方式评估攻击的效果和效率。
  • 实证分析基于超过100种攻击在CIFAR-10和ImageNet模型上的800多种不同配置。
  • 发现只有少数攻击能够超越其他竞争方法。
  • 揭示了阻碍许多攻击找到更好解决方案或运行的实现问题。
  • AttackBench是公开可用的基准,并致力于不断更新以评估新的梯度攻击方法。
➡️

继续阅读