基于提示的大型语言模型是否认识学生的特征并在作文评分中引入偏见?
📝
内容提要
本研究探讨了基于提示的自动作文评分系统中的潜在偏见,尤其是对于弱势群体的影响。通过分析超过25,000篇学生的论证性作文,发现大型语言模型(LLMs)能够推测出学生的某些特征,且在评分时此推测可能导致更明显的评分偏见,尤其是在非母语英语者的情况下。该研究为改进自动评分公平性提供了重要见解。
🏷️
标签
➡️