大型语言模型(LLMs)在招聘和招生等资源有限的环境中被广泛应用,但可能反映和加剧社会偏见。研究扩展了单轴公平评估,关注交叉偏见,创建了WinoIdentity基准,评估245,700个提示中的50种偏见模式。结果显示,LLMs在某些身份群体上的信心差异可达40%,尤其在反刻板印象的情境中,对双重弱势身份的信心最低。这表明LLMs的表现可能更多依赖于记忆而非逻辑推理。
本文讨论了种族、年龄和性别等因素的交叉偏见问题,并提出了性能差异的种族、年龄和性别组合方面的研究。研究结果表明,人脸识别系统存在普遍偏见,不同的人口统计因素导致不同的结果。
本文分析了人脸识别系统中存在的交叉偏见问题,特别关注了种族、年龄和性别组合方面的性能差异。通过引入五个补充指标,研究结果表明人脸识别系统存在普遍偏见,不同的人口统计因素导致显著不同的结果。本文旨在促进进一步研究,以开发更公正、更公平的人脸识别和验证系统。
完成下面两步后,将自动完成登录并继续当前操作。