小红花·文摘

本研究提出了一种检测神经网络中后门威胁的方法，开发了无人监督的触发器检测器。用户研究表明，ML开发者在37%的情况下能识别后门，但有33%的情况下更喜欢带后门的模型。文章最后讨论了防御策略，强调保障机器学习系统完整性的重要性。