鲁棒性一致的对抗训练用于安全机器学习模型更新
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种名为“双梯度投影”的方法,用于解决机器学习系统在学习新任务时容易忘记先前的对抗鲁棒性的问题。该方法通过将权重更新的梯度正交投影到两个关键子空间上,实现连续鲁棒学习。实验结果表明,该方法有效地保持了连续鲁棒性,并对抗强对抗攻击的效果优于其他方法。
🎯
关键要点
- 机器学习系统的安全性和可靠性需要对抗鲁棒性。
- 神经网络在学习新任务时容易忘记先前的对抗鲁棒性。
- 提出了一种名为“双梯度投影”的方法,解决对抗鲁棒性遗忘的问题。
- 该方法通过将权重更新的梯度正交投影到两个关键子空间上,实现连续鲁棒学习。
- 两个子空间分别用于稳定平滑的样本梯度和稳定神经网络的最终输出。
- 实验结果表明,该方法有效保持连续鲁棒性,优于其他防御策略和连续学习方法的基准线。
➡️