提升人工智能系统的安全性:一种检测深度神经网络后门的新方法
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新的神经网络后门检测和修复方法,通过实验证明其在文本和图像分类中的有效性。该方法可以检测和修复植入后门的数据,无需可验证和可信数据集。
🎯
关键要点
- 提出了一种新的神经网络后门检测和修复方法。
- 该方法经过广泛实验验证了在文本和图像分类中的有效性。
- 针对机器学习训练数据可能不可信的现实情况。
- 恶意攻击者可能通过植入精心制作的样本来攻击系统。
- 这是首个不需要可验证和可信数据集即可检测和修复植入后门的方法。
➡️