联邦组合多智能体多臂赌博机

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该论文介绍了一个用于在线组合优化和有限带反馈的联邦学习框架,具有多代理算法和次线性增长,随着通信代理数量的增加而线性加速。该算法通过实证验证展示了框架的有效性。

🎯

关键要点

  • 该论文介绍了一个用于在线组合优化和有限带反馈的联邦学习框架。
  • 框架将复杂度为 O(psi/epsilon^beta) 的离线单代理算法转化为在线多代理算法。
  • 算法保证了与时间跨度 T 的次线性增长,并随着通信代理数量的增加而线性加速。
  • 该算法具有高效的通信特性,只需亚线性数量的通信轮次。
  • 框架成功应用于在线随机子模块最大化,取得了单代理和多代理设置的结果。
  • 通过对随机数据摘要问题的实证验证展示了框架的有效性。
➡️

继续阅读