本研究提出了一种检测神经网络中后门威胁的方法,开发了无人监督的触发器检测器。用户研究表明,ML开发者在37%的情况下能识别后门,但有33%的情况下更喜欢带后门的模型。文章最后讨论了防御策略,强调保障机器学习系统完整性的重要性。
完成下面两步后,将自动完成登录并继续当前操作。