BriefGPT - AI 论文速递 ·

通过迭代过滤检测不可学习示例

💡 原文中文，约1700字，阅读约需5分钟。

📝

内容提要

本研究探讨了半监督机器学习中的污染攻击，提出了多种防御方法，包括基于矩阵填充的对策和伪装数据污染攻击的应对策略。研究表明，强调数据惯性的编码器能有效抵御攻击。此外，提出了一种新方法以保护不可学习示例，利用深度学习模型降低个人信息泄露风险，并设计了新型防御机制以提高鲁棒性。

🎯

❓

污染攻击是一种针对半监督机器学习模型的攻击方式，通过添加或删除训练数据中的特定点，影响模型的预测准确性。

研究提出了基于矩阵填充的对策和强调数据惯性的编码器，此外还介绍了伪装数据污染攻击的应对策略。

不可学习示例通过微不可见的扰动进行保护，确保原始数据无法被精确分类，同时提出了新方法利用联合条件扩散模型去除噪音。

伪装数据污染攻击通过在训练数据集中添加精心构造的点并删除部分数据，导致模型预测产生负面影响。

通过引入稳定的误差最小化噪声（SEM）和针对随机扰动进行训练，可以提高不可学习示例的鲁棒性。

现有的机器遗忘方法在消除数据污染影响方面表现不佳，无法有效应对各种类型的污染攻击。

🏷️