本论文研究了一种获取语言模型中编码信念的统计方法,并探讨了不同语言模型中的道德信念。研究发现,大多数模型在明确情景中选择与常识一致的行动,而在模棱两可的情况下表达了不确定性。部分模型对问题的方式非常敏感,闭源模型之间的一致性较高。
本论文研究了一种获取语言模型中编码信念的统计方法,并探讨了不同语言模型中的道德信念。调查结果显示,大多数模型在明确情景中选择与常识一致的行动,而在模棱两可的情况下表达了不确定性。
完成下面两步后,将自动完成登录并继续当前操作。