Dark Distillation: Backdooring Distilled Datasets without Accessing Raw Data

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究探讨了数据集蒸馏中的安全性问题,提出了一种新方法,通过重建类别原型,在不访问原始数据的情况下向蒸馏数据集中注入后门。实验表明,蒸馏数据集易受攻击,该方法高效,能快速合成恶意数据集。

🎯

关键要点

  • 本研究探讨了数据集蒸馏过程中的安全性问题,特别是后门注入威胁。

  • 提出了一种新方法,通过重建类别原型向蒸馏数据集中注入后门,无需访问原始数据。

  • 实验结果表明,蒸馏数据集在多种情况下易受后门攻击。

  • 该攻击方法高效,能够快速合成恶意的蒸馏数据集。

➡️

继续阅读