小红花·文摘

本研究提出了道德基础LLM数据集（MFD-LLM），旨在探讨大型语言模型的隐性偏见和道德倾向。评估结果显示，顶尖模型在价值偏好上存在显著同质性，但缺乏一致性，为未来的优化提供了启示。