本文研究了非随机联邦多臂老虎机问题,提出了新算法FEDEXP3,能够在不交换信息的情况下实现次线性遗憾。同时,探讨了在自适应对手和有限反馈条件下的分布式在线优化,提出了有效的合作策略和算法,并验证了其在合成和真实数据集上的有效性。
完成下面两步后,将自动完成登录并继续当前操作。