预训练特征提取器的不可区分数据毒化攻击
原文中文,约300字,阅读约需1分钟。发表于: 。在这篇论文中,我们研究了预训练特征提取器应用于后续任务时的数据污染攻击,主要包括输入空间攻击和特征目标攻击两种类型,实验结果表明后者对迁移学习更具威胁性。
本文介绍了PoisonedEncoder数据污染攻击方法,通过注入污染输入构建中毒编码器的下游分类器,使其将任意干净输入分类为任意类别。同时,作者提出了对比度学习方法来近似解决该问题,并评估了五种防御策略。
在这篇论文中,我们研究了预训练特征提取器应用于后续任务时的数据污染攻击,主要包括输入空间攻击和特征目标攻击两种类型,实验结果表明后者对迁移学习更具威胁性。
本文介绍了PoisonedEncoder数据污染攻击方法,通过注入污染输入构建中毒编码器的下游分类器,使其将任意干净输入分类为任意类别。同时,作者提出了对比度学习方法来近似解决该问题,并评估了五种防御策略。