本研究提出了道德基础LLM数据集(MFD-LLM),旨在探讨大型语言模型的隐性偏见和道德倾向。评估结果显示,顶尖模型在价值偏好上存在显著同质性,但缺乏一致性,为未来的优化提供了启示。
大型语言模型在人工智能领域具有重要作用,但也带来伦理风险和挑战。本文调查了人工智能伦理准则,并提出了重新评估的建议。同时,利用道德基础理论研究了大型语言模型的道德倾向,并讨论了对齐伦理价值观的挑战和研究方向。这是构建符合伦理要求的人工智能的初步步骤。
完成下面两步后,将自动完成登录并继续当前操作。