本研究探讨大型语言模型(LLMs)在精神和道德价值方面的偏见,发现其价值观多样,影响其在社会公平场景中的表现,尤其是在仇恨言论识别中。建议对LLMs进行再训练,以减少偏见。
完成下面两步后,将自动完成登录并继续当前操作。