本研究探讨了语言模型中的道德信念,设计了680个道德情境的调查,分析了28个语言模型的反应。结果表明,在明确情境中,模型倾向于选择常识性行为,而在模棱两可的情境中则表现出不确定性和敏感性。
RLAdapter是一种适配器模型,用于强化学习和大型语言模型之间的联系。在Crafter环境中的实验表明,RLAdapter超过了基线模型,代理展现出了常识行为。
完成下面两步后,将自动完成登录并继续当前操作。