Google DeepMind Blog ·

以人为本的民主人工智能机制设计

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

研究表明，深度强化学习可以用于识别经济政策上的投票偏好。通过一个简单的游戏，玩家决定如何分配投资收益。AI设计的政策比传统政策更受欢迎，且更能反映人类价值观，确保人类在决策中的参与。研究强调了民主决策中多数与少数意见的平衡。

🎯

❓

深度强化学习通过模拟人类玩家的行为，训练AI系统以最大化人类的投票偏好，从而识别经济政策的投票偏好。

AI设计的政策更受欢迎，且更能反映人类价值观，确保人类在决策中的参与。

玩家通过一个简单的游戏决定如何分配投资收益，游戏中每个玩家可以选择将资金保留或投资于共同池。

研究强调在民主决策中，必须考虑多数与少数意见的平衡，尤其是如何处理相对偏好。

AI通过学习最大化人类的投票偏好，确保其政策与人类价值观一致，减少不安全或不公平的政策出现。

游戏设计为四名玩家参与，分为两轮，每轮由不同的裁判进行资金再分配，玩家在游戏结束后投票选择裁判。

🏷️