小红花·文摘

本文探讨了多语言模型在道德判断中的表现，发现这些模型编码了道德偏见，但与人类文化差异不完全一致。研究分析了不同语言模型在模棱两可情境下的道德推理能力，结果表明模型的道德判断受提示语言影响，并存在偏见。强调在大型语言模型开发中考虑道德推理的重要性。

通过多元框架评估大语言模型的道德信仰

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在道德推理和价值观识别中的表现，提出了多个框架和数据集以分析其道德偏见。研究发现，LLMs在明确情境中表现一致，但在模棱两可的情况下则显得不确定，并存在西方中心主义的偏见。通过行为经济学框架评估，LLMs的决策行为与人类相似，强调了在开发和评估中考虑道德推理的重要性。

日常困境：揭示大型语言模型在日常生活中的价值偏好

BriefGPT - AI 论文速递 ·

该研究探讨了大型语言模型（如GPT-3）在道德和伦理方面的表现，发现它们在特定提示下会反映出道德偏见。研究提出了评估和对齐这些模型价值观的方法，强调道德推理在AI决策中的重要性，并展示了实验验证模型道德一致性和潜在风险的方式。

朝向“差异化人工智能心理学”及与道德基础理论的背景价值驱动声明对齐

BriefGPT - AI 论文速递 ·

本文探讨大型语言模型（LLMs）在因果和道德判断方面与人类的相符度。研究发现，尽管模型的判断能力有所提高，但在不同因素的重视程度上仍存在差异。此外，预训练的多语言模型可能编码道德偏见，这些偏见不一定反映人类文化的差异。研究强调了多语言预训练数据集的重要性，以更好地代表人类经验的多样性。

跨文化对齐是否改变语言模型的常识道德？

BriefGPT - AI 论文速递 ·