高效沟通的联邦非线性赌博机优化
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究提出了一种新的联邦多臂老虎机问题,通过通信网络合作。算法FEDEXP3可以在不交换代理之间选择的手臂编号或损失序列的情况下得到次线性遗憾。数值评估证明了该算法的有效性。
🎯
关键要点
- 研究提出了一种新的非随机联邦多臂老虎机问题,涉及多个代理通过通信网络合作。
- 损失由所有代理在每个时间步长和每个手臂的损失的笨拙对手分配。
- 为任何联邦老虎机算法提供遗憾下限,适用于完整信息反馈或老虎机反馈的情况。
- 提出了接近最优的联邦老虎机算法FEDEXP3,能够在不交换手臂编号或损失序列的情况下实现次线性遗憾。
- 通过数值评估验证了FEDEXP3算法的有效性,适用于合成和现实世界数据集。
➡️