Subtle Hints: Detecting Hidden Backdoors in Black-Box Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了 extsc{BProm}方法,通过视觉提示识别黑盒模型中的后门,解决了干净数据集与污染数据集的类子空间不一致性问题,实验结果验证了其有效性。
🎯
关键要点
- 本研究提出了BProm方法,解决黑盒模型中的后门检测问题。
- BProm方法通过视觉提示识别干净数据集与污染数据集之间的类子空间不一致性。
- 该方法利用模型在存在后门时分类准确率低的特性,有效识别可疑模型中的后门。
- 实验结果验证了BProm方法的有效性。
➡️