小红花·文摘

本研究探讨了人工智能中目标和价值的涌现问题，利用效用函数框架分析AI偏好的内部一致性。研究发现，大型语言模型的偏好结构高度一致，表明形成了有意义的价值体系，这对AI的设计和控制具有重要影响。