提高对抗鲁棒性的标准差启发式正则化
📝
内容提要
本研究解决了深度神经网络在对抗攻击下鲁棒性不足的问题。提出了一种基于标准差的正则化方法,旨在通过最大化模型输出概率的修改标准差来增强对抗训练的效果。实验结果表明,该方法能显著提升神经网络对更强攻击(如CW和Auto-attack)的鲁棒性,且改善了模型的泛化能力。
🏷️
标签
➡️