黑暗蒸馏:在不访问原始数据的情况下对蒸馏数据集进行后门攻击
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方法,通过重建类别原型在蒸馏数据集中注入后门,无需原始数据。实验表明,蒸馏数据集易受后门攻击,且该方法高效。
🎯
关键要点
- 本研究提出了一种新方法,通过重建类别原型在蒸馏数据集中注入后门。
- 该方法无需访问任何原始数据。
- 实验结果表明,蒸馏数据集在多种情况下易受后门攻击。
- 该攻击方法具有效率,能够在短时间内合成恶意的蒸馏数据集。
- 研究解决了数据集蒸馏过程中的安全性问题,特别是针对蒸馏数据集的后门注入威胁。
➡️