本文研究了多智能体多臂赌博机方法的遗憾下界,证明了在不同情景下的紧密性。当图表现出良好的连通性和奖励是随机分布时,遗憾下界为O(log T)和sqrt(T)。在对抗奖励的假设下,遗憾下界为O(T^(2/3))。当图不连通时,遗憾下界为线性。与以前的研究相比,本文全面研究了这些情景下的紧密下界。
本文研究了多智能体多臂赌博机方法中的遗憾下界,证明了它们的紧密性。当图表现出良好的连通性和奖励是随机分布时,证明了实例相关上界的 O(log T)下界和平均差值独立上界的 sqrt(T)下界。在对抗奖励的假设下,建立了连接图的 O(T^(2/3))下界。当图表现为不连通时,还展示了线性的遗憾下界。
完成下面两步后,将自动完成登录并继续当前操作。