使用 Datamodels(D3M)进行数据去偏:通过数据选择提高子群体鲁棒性

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

神经网络在偏见数据集上训练时容易学习到偏见相关性,影响泛化和鲁棒性。研究者提出了一种新的去偏方法DeNetDM,通过专家产品的训练范例创建带有偏见和去偏见架构的模型,并通过模型转移生成目标去偏模型。实验证明该方法在三个数据集上取得了约5%的改进,无需偏见标签或注释。此外,该方法有效利用了数据中的多样性点,超越了以前的方法。

🎯

关键要点

  • 神经网络在偏见数据集上训练时容易学习到偏见相关性,影响泛化和鲁棒性。
  • 提出了一种新的去偏方法DeNetDM,基于专家产品的训练范例创建带有偏见和去偏见架构的模型。
  • 通过模型转移生成目标去偏模型,实验证明该方法在三个数据集上取得了约5%的改进。
  • DeNetDM无需偏见标签或注释,能够与有监督的对照模型表现相当。
  • 该方法有效利用数据中的多样性点,超越了以前的方法,避免了显式增强多样性的数据增强方法。
➡️

继续阅读