健康有影响力的噪声训练以抵御数据投毒攻击

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该文讨论了对使用用户提供数据训练的机器学习系统进行的数据毒化攻击问题,并提出了一种防御方法。在MNIST-1-7和Dogfish数据集上,该方法表现较好,但在IMDB情感数据集上,加入3%的毒化数据会导致测试误差从12%提升至23%。

🎯

关键要点

  • 讨论了对使用用户提供数据训练的机器学习系统进行的数据毒化攻击问题。

  • 提出了一种防御方法,基于数据异常移除和经验风险最小化。

  • 在MNIST-1-7和Dogfish数据集上,该防御方法表现较好。

  • 在IMDB情感数据集上,加入3%的毒化数据导致测试误差从12%提升至23%。

➡️

继续阅读