小红花·文摘

本研究探讨了在对手干扰样本情况下进行统计任务的能力，证明了自适应和无意识对手在样本规模上的等效性，并提出了简单高效的算法构建方法，可能对统计学习理论产生深远影响。

Adaptive and Oblivious Statistical Adversaries are Equivalent

BriefGPT - AI 论文速递 ·

本文研究了带有动作切换代价的敌对多臂赌博机问题，证明了玩家的最小极大后悔度为Θ(T^2/3)。探讨了反馈在在线学习中的作用，提出了优化算法以减少期望后悔，并研究了不同类型自适应对手的影响。还提出了新算法以改善政策遗憾边界，展示了在动态情况下的最佳后悔上限。

具有切换成本的对抗组合赌博机

BriefGPT - AI 论文速递 ·

本研究探讨了面对自适应对手时的分布式在线和掷骰机凸优化问题。结果表明，在机器能够访问查询点的一阶梯度信息时，合作是没有益处的。然而，在只能访问成本函数值的情况下，合作可能导致机器数量的线性加速。通过开发新的分布式算法，研究结果在联邦对抗线性掷骰机中得到了应用。这项研究填补了联邦在线优化中随机和自适应环境之间的差距。

在线凸优化的广义方法

BriefGPT - AI 论文速递 ·

本研究探讨了面对自适应对手时的分布式在线和掷骰机凸优化问题。结果表明，在机器能够访问查询点的一阶梯度信息时，合作是没有益处的。然而，在只能访问查询点的成本函数值的情况下，合作可能有益且可能导致机器数量的线性加速。通过开发新的分布式算法，进一步说明了研究结果在联邦对抗线性掷骰机中的应用。这项研究填补了联邦在线优化中随机和自适应环境之间的差距。

随机链路故障下的分散式多任务在线凸优化

BriefGPT - AI 论文速递 ·

本研究探讨了面对自适应对手时的分布式在线和掷骰机凸优化问题。研究发现，在机器能够访问查询点的一阶梯度信息时，合作是没有益处的。然而，在只能访问查询点的成本函数值的情况下，合作可能有益且可能导致机器数量的线性加速。通过开发新的分布式反馈算法，研究结果在联邦对抗线性掷骰机中得到了应用。这项研究填补了联邦在线优化中随机和自适应环境之间的差距。

多方偏好加速收敛

BriefGPT - AI 论文速递 ·

本文研究了面对自适应对手时的分布式在线和掷骰机凸优化问题。研究结果表明，在机器能够访问所查询点的一阶梯度信息时，合作是没有益处的。然而，在只能访问成本函数值的情况下，合作可能导致机器数量的线性加速。通过开发新的分布式反馈算法，进一步说明了研究结果在联邦对抗线性掷骰机中的应用。填补了联邦在线优化中随机和自适应环境之间的差距。

联邦在线与强盗凸优化

BriefGPT - AI 论文速递 ·