具有灵活个性化的联邦$\mathcal{X}$-臂赌博机
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该论文介绍了一个用于在线组合优化和有限带反馈的联邦学习框架,将离线单代理逼近算法转化为具有多代理算法,并保证了与时间跨度T的次线性增长,且随着通信代理数量的增加而线性加速。通过实证验证展示了该框架的有效性。
🎯
关键要点
-
该论文介绍了一个用于在线组合优化和有限带反馈的联邦学习框架。
-
框架将复杂度为O(psi/epsilon^beta)的离线单代理逼近算法转化为在线多代理算法。
-
算法保证了与时间跨度T的次线性增长,且随着通信代理数量的增加而线性加速。
-
该算法具有高效的通信特性,只需亚线性数量的通信轮次。
-
框架成功应用于在线随机子模块最大化,展示了单代理和多代理设置的结果。
-
通过对随机数据摘要问题的实证验证,展示了框架的有效性。
➡️