攻击基准:对于对抗性样本的基于梯度的攻击评估
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
AttackBench是一个公平比较框架,用于评估对抗样本优化的攻击。实证分析发现只有少数攻击能够超越其他竞争方法,并揭示了一些实现问题。AttackBench作为一个公开可用的基准,并不断更新以包含和评估新的梯度攻击方法。
🎯
关键要点
- AttackBench是一个公平比较框架,用于评估对抗样本优化的攻击。
- 通过分类梯度攻击、定义优化度量标准和限制查询次数等方式评估攻击的效果和效率。
- 实证分析基于超过100种攻击在CIFAR-10和ImageNet模型上的800多种不同配置。
- 发现只有少数攻击能够超越其他竞争方法。
- 揭示了阻碍许多攻击找到更好解决方案或运行的实现问题。
- AttackBench是公开可用的基准,并致力于不断更新以评估新的梯度攻击方法。
🏷️
标签
➡️