理解亚群体对中毒攻击的敏感性变异
原文中文,约200字,阅读约需1分钟。发表于: 。机器学习中的中毒攻击容易受到数据集可分离性和子群体属性的影响,本文通过实验发现了这些因素对不同子群体的有效性产生的影响,并且还发现了对某些语义相关的子群体具有易受攻击的特性。
该文章讨论了对使用用户数据训练的机器学习系统进行数据毒化攻击的问题,并提出了一种防御方法。该方法在MNIST-1-7和Dogfish数据集上表现出较强的防御能力,但在IMDB情感数据集上加入3%的毒化数据会导致测试误差从12%提升至23%。