攻击基准:对于对抗性样本的基于梯度的攻击评估
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了 AttackBench 作为第一个用于评估对抗样本优化的攻击的公平比较框架,通过分类梯度攻击、定义优化度量标准和限制查询次数等方式评估攻击的效果和效率,并通过对超过 100 种攻击实现在 CIFAR-10 和 ImageNet 模型上的 800 多种不同配置的实证分析,发现只有很少的攻击能够超越所有其他竞争方法,同时揭示了阻碍许多攻击找到更好解决方案或运行的几个实现问题,我们将...
AttackBench是一个公平比较框架,用于评估对抗样本优化的攻击。实证分析发现只有少数攻击能够超越其他竞争方法,并揭示了一些实现问题。AttackBench作为一个公开可用的基准,并不断更新以包含和评估新的梯度攻击方法。