本文提出了多种联邦多臂老虎机算法,如Federated Double UCB、PF-UCB和FEDEXP3,研究了个性化与合作的平衡,优化了通信效率和遗憾率。通过理论分析和实验验证,展示了这些算法在合成和真实数据集上的有效性,尤其是在异构客户端环境中的应用。
研究提出了一种新的联邦多臂老虎机问题,通过通信网络合作。算法FEDEXP3可以在不交换代理之间选择的手臂编号或损失序列的情况下得到次线性遗憾。数值评估证明了该算法的有效性。
完成下面两步后,将自动完成登录并继续当前操作。