预训练特征提取器的不可区分数据毒化攻击

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了PoisonedEncoder数据污染攻击方法,通过注入污染输入构建中毒编码器的下游分类器,使其将任意干净输入分类为任意类别。同时,作者提出了对比度学习方法来近似解决该问题,并评估了五种防御策略。

🎯

关键要点

  • 提出了一种数据污染攻击方法——PoisonedEncoder。
  • 攻击通过在无标签的预训练数据中注入污染输入。
  • 构建基于中毒编码器的下游分类器,使其将干净输入分类为任意类别。
  • 提出了一种对比度学习的方法来近似解决数据污染攻击问题。
  • 评估了五种针对PoisonedEncoder的防御策略。
➡️

继续阅读