直接歧视的结构证据的本地因果发现

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种新的基于风险差的算法,通过创建因果贝叶斯知识图,发现了机器学习模型中的偏见,并提出了快速适应的偏差控制方法。在合成和实际数据集上进行了广泛实验,证明了该方法可以高效地检测偏见并减轻模型输出上的偏见,同时在训练样本量少的未见任务上具有较好的精度和公平度的泛化能力。

🎯

关键要点

  • 提出了一种新的基于风险差的算法。
  • 通过创建因果贝叶斯知识图发现机器学习模型中的偏见。
  • 量化每个受保护变量在图中的歧视影响力。
  • 提出了一种快速适应的偏差控制方法。
  • 在元学习中高效减少组的不公平性。
  • 在合成和实际数据集上进行了广泛实验。
  • 证明了该方法可以高效检测偏见并减轻模型输出上的偏见。
  • 在训练样本量少的未见任务上具有较好的精度和公平度的泛化能力。
➡️

继续阅读