本研究探讨了问答和阅读理解基准中的偏见问题,指出其在不同人群和地区的代表性不足,呼吁在基准创建中关注偏见,以促进公平的大语言模型发展。
本研究分析了问答和阅读理解基准中的偏见问题。
指出现有基准在不同人群和地区的代表性不足。
通过定性和定量分析展示参与者背景对内容偏见的影响。
呼吁在基准创建中采取更加透明和关注偏见的做法。
旨在推动更公平的大语言模型的开发。
完成下面两步后,将自动完成登录并继续当前操作。