预训练特征提取器的不可区分数据毒化攻击
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了PoisonedEncoder数据污染攻击方法,通过注入污染输入构建中毒编码器的下游分类器,使其将任意干净输入分类为任意类别。同时,作者提出了对比度学习方法来近似解决该问题,并评估了五种防御策略。
🎯
关键要点
- 提出了一种数据污染攻击方法——PoisonedEncoder。
- 攻击通过在无标签的预训练数据中注入污染输入。
- 构建基于中毒编码器的下游分类器,使其将干净输入分类为任意类别。
- 提出了一种对比度学习的方法来近似解决数据污染攻击问题。
- 评估了五种针对PoisonedEncoder的防御策略。
🏷️
标签
➡️