本研究探讨大型语言模型在模拟人类行为时的隐性偏见,并提出揭示社会人口类别决策差异的技术。尽管模型在减少显性偏见方面有所进展,但隐性偏见仍然显著,需要新的应对策略。
本文提出了一种新的公平判定方法:努力平等,该方法考虑了决策差异、个体实现结果水平的合理变化和努力差异。研究团队开发了算法来检测和消除歧视影响,实验结果表明努力平等的算法更为有效。
完成下面两步后,将自动完成登录并继续当前操作。