小红花·文摘 - 小红花技术领袖俱乐部

本研究探讨大型语言模型在模拟人类行为时的隐性偏见，并提出揭示社会人口类别决策差异的技术。尽管模型在减少显性偏见方面有所进展，但隐性偏见仍然显著，需要新的应对策略。

Actions Speak Louder Than Words: Revealing Implicit Bias in Language Models through Proxy Decision-Making

BriefGPT - AI 论文速递 ·

本文提出了一种新的公平判定方法：努力平等，该方法考虑了决策差异、个体实现结果水平的合理变化和努力差异。研究团队开发了算法来检测和消除歧视影响，实验结果表明努力平等的算法更为有效。

算法追责中的公平：以实质机会平等为视角

BriefGPT - AI 论文速递 ·