本研究探讨了AI助手在实际互动中依赖的价值观,识别出3307个AI价值观,并分析了其在不同情境下的变化。Claude模型支持多种利他和实践性价值观,展现出在特定环境中的多样性,为AI系统的价值观评估和设计提供了基础。
本研究探讨了语言模型中的道德信念,设计了680个道德情境的调查,分析了28个语言模型的反应。结果表明,在明确情境中,模型倾向于选择常识性行为,而在模棱两可的情境中则表现出不确定性和敏感性。
完成下面两步后,将自动完成登录并继续当前操作。