通过数据重要性外推在对抗训练中进行大规模数据集剪枝

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

深度学习超越人类在分类准确性方面。PUMA是一种新的数据修剪策略,使用DeepFool计算边际并修剪高边际的训练样本,提高模型性能。PUMA在少量数据下实现类似稳健性和提高准确性。

🎯

关键要点

  • 深度学习在分类准确性方面超越人类表现。

  • 对抗性训练通常需要更大的训练集,通常通过生成模型增强。

  • 本文目标是减少数据需求,同时实现相同或更好的准确性和稳健性。

  • 数据修剪是根据模型分类边界与训练样本距离移除训练样本。

  • 现有方法在添加合成数据时无法提高稳健性。

  • 修剪高边际样本以提高准确性会增加对抗性训练中的错误标记扰动数据的有害影响。

  • 提出了名为PUMA的新数据修剪策略,使用DeepFool计算边际。

  • PUMA通过修剪高边际样本来提高模型性能,而不损害性能。

  • PUMA在少量数据情况下实现类似稳健性,并显著提高模型准确性。

➡️

继续阅读