多智能体随机可共享臂容量的多臂赌博机

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

研究了多智能体多臂赌博问题,智能体观察邻居的选择和奖励,通过算法最大化自己的奖励,预测智能体的性能排名。

🎯

关键要点

  • 研究了多智能体多臂赌博问题。
  • 智能体可以观察邻居的选择和奖励。
  • 邻居由具有异构和随机互连的网络图定义。
  • 互动由每个智能体的社交性决定。
  • 为每个智能体设计算法以最大化其预期累积奖励。
  • 证明了依赖于智能体和网络结构的社交性能边界。
  • 使用社交性能边界预测智能体的性能排名。
  • 进行了理论和计算上的验证。
➡️

继续阅读