AI 对齐的社会选择:应对多样化的人类反馈

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

大型语言模型的普遍存在预示着它们将相互编程并形成新兴的人工智能主体性、关系和集体。研究界应调查这些互动人工智能的“类社会”属性,以增加其对人类社会和在线环境的回报并减少风险。同时,应解决与创建和维护分散型人工智能集体相关的道德问题和设计挑战。

🎯

关键要点

  • 大型语言模型根据其他人生成的文本来引导行为。
  • 这些模型的普遍存在预示着它们将相互编程并形成新兴的人工智能主体性、关系和集体。
  • 研究界应调查互动人工智能的类社会属性,以增加对人类社会和在线环境的回报并减少风险。
  • 使用简单模型说明新兴分散型人工智能集体如何扩大人类多样性范围并降低在线毒性和反社交行为的风险。
  • 讨论人工智能自我调节的机会,以及与创建和维护分散型人工智能集体相关的道德问题和设计挑战。
➡️

继续阅读