本研究提出了一种四阶段的框架来评估大型语言模型生成的内容中的刻板印象和偏见,并以教育领域为案例研究构建了Edu-FairBench。实验结果显示五个LLMs存在不同程度的刻板印象和偏见,自动评估方法与人工注释相关性高。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: