通过对抗性输出日志更新推进对抗鲁棒性

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文从理论的角度分析了对抗攻击周围的逻辑差异,并提出了一种新的原则,即 Adversarial Logit Update (ALU),用于推断对抗样本的标签。基于ALU,引入了一种新的分类范式,利用预净化和后净化的逻辑差异来提高模型的对抗鲁棒性。实验证明,该解决方案在CIFAR-10、CIFAR-100和tiny-ImageNet数据集上具有卓越的鲁棒性能。

🎯

关键要点

  • 从理论角度分析成功的对抗攻击周围的逻辑差异。
  • 提出新的原则 Adversarial Logit Update (ALU),用于推断对抗样本的标签。
  • 基于 ALU 引入新的分类范式,利用预净化和后净化的逻辑差异。
  • 提高模型的对抗鲁棒性。
  • 经过广泛实验证明,解决方案在 CIFAR-10、CIFAR-100 和 tiny-ImageNet 数据集上具有卓越的鲁棒性能。
➡️

继续阅读