决策边界检测后门模型的 X 射线模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究人员提出了一种新的后门攻击检测方法Model X-ray,通过对决策边界进行分析,可以确定目标API是否受到后门攻击,并确定攻击标签。实验证明该方法对不同后门攻击、数据集和架构的MLaaS都有效。
🎯
关键要点
- 研究人员提出了一种新的后门攻击检测方法,名为Model X-ray。
- 该方法通过分析决策边界来确定目标API是否受到后门攻击。
- Model X-ray能够识别攻击标签,且不依赖于攻击假设和模型训练细节。
- 通过对干净输入的硬预测,Model X-ray可以有效检测后门攻击。
- 广泛的实验证明该方法对不同后门攻击、数据集和架构的MLaaS均有效。
🏷️
标签
➡️