本文提出了一种新的基于风险差的算法,通过创建因果贝叶斯知识图,发现了机器学习模型中的偏见,并量化了每个受保护变量在图中的歧视影响力。同时,还提出了一种快速适应的偏差控制方法,有效减少了元学习中组的不公平性。通过实验验证了该方法可以高效地检测偏见,并减轻模型输出上的偏见,同时在训练样本量少的未见任务上具有较好的精度和公平度的泛化能力。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: