PureGen: 通用数据净化方法 —— 基于生成模型动态的训练时毒素防御
原文中文,约300字,阅读约需1分钟。发表于: 。利用随机变换介绍的普遍数据净化方法,通过迭代 Langevin 动力学算法行为模型(EBMs)、去噪扩散概率模型(DDPMs)或两者的能量波动来净化被污染的数据,最小化对分类器泛化性能的影响,并在 CIFAR-10、Tiny-ImageNet 和 CINIC-10 上提供针对多种攻击(包括 Narcissus、Bullseye Polytope 和 Gradient...
该研究提出了一种经过认证的防御方法来对抗无标签污染攻击,成功率降低到0-16%,同时几乎不影响测试准确率。该方法在降低攻击成功率和保持模型效用方面表现最好,可作为评估的基准。