CMoralEval:中文大型语言模型的道德评估基准
原文中文,约400字,阅读约需1分钟。发表于: 。本文针对中文大型语言模型在道德相关背景下的表现,构建了一个名为CMoralEval的大规模道德评估基准,以填补现有研究中的空白。研究提出了一种结合传统文化与现代社会规范的道德分类法,并通过多元真实的数据源创建了包含近三万条道德实例的数据集。实验表明,CMoralEval是中文大型语言模型的一个具有挑战性的基准,具有重要的研究价值和应用潜力。
本论文研究了一种获取语言模型中编码信念的统计方法,并探讨了不同语言模型中的道德信念。研究发现,大多数模型在明确情景中选择与常识一致的行动,而在模棱两可的情况下表达了不确定性。部分模型对问题的方式非常敏感,闭源模型之间的一致性较高。