本文探讨了在多个个体中实现人工智能价值一致性的挑战,提出了一种基于社会选择理论的政策聚合方法,通过序数偏好与状态-动作占用多面体体积的关联来解决问题。研究表明,批准投票等方法可有效用于政策聚合。
完成下面两步后,将自动完成登录并继续当前操作。