本文研究深度神经网络的后门攻击问题,提出了一种基于L∞规范的神经元修剪方法,能够有效降低攻击成功率超过50%。该方法无需调整DNN参数,运行速度快,能够检测带触发器的实例,提高分类准确度并减轻过拟合问题。
本文研究深度神经网络的后门攻击问题,提出了一种基于L∞规范的神经元修剪方法,以消除后门。研究表明,该方法在保持高分类准确度的同时,显著降低了后门攻击的成功率。同时,探讨了多种后门攻击方式及其对深度学习模型的威胁,强调了在训练过程中注入后门的隐蔽性和有效性。
完成下面两步后,将自动完成登录并继续当前操作。