Defense Against Model Stealing Based on Account-Aware Distribution Discrepancy
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的防御模型盗用的方法——账户感知分布差异(ADD),旨在识别恶意查询。实验结果表明,D-ADD模块在图像分类模型中有效防御多种攻击,同时对正常用户的影响较小。
🎯
关键要点
- 本研究提出了一种新的防御模型盗用的方法——账户感知分布差异(ADD)。
- ADD通过利用账户的局部依赖性来识别恶意查询。
- 实验结果表明,D-ADD模块在图像分类模型中有效防御多种攻击。
- D-ADD对正常用户的服务干扰较小。
➡️