使用 Datamodels(D3M)进行数据去偏:通过数据选择提高子群体鲁棒性
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
神经网络在偏见数据集上训练时容易学习到偏见相关性,影响泛化和鲁棒性。研究者提出了一种新的去偏方法DeNetDM,通过专家产品的训练范例创建带有偏见和去偏见架构的模型,并通过模型转移生成目标去偏模型。实验证明该方法在三个数据集上取得了约5%的改进,无需偏见标签或注释。此外,该方法有效利用了数据中的多样性点,超越了以前的方法。
🎯
关键要点
- 神经网络在偏见数据集上训练时容易学习到偏见相关性,影响泛化和鲁棒性。
- 提出了一种新的去偏方法DeNetDM,基于专家产品的训练范例创建带有偏见和去偏见架构的模型。
- 通过模型转移生成目标去偏模型,实验证明该方法在三个数据集上取得了约5%的改进。
- DeNetDM无需偏见标签或注释,能够与有监督的对照模型表现相当。
- 该方法有效利用数据中的多样性点,超越了以前的方法,避免了显式增强多样性的数据增强方法。
➡️