该研究探讨了分布式多臂赌博设置在流言传播模型中的应用,推导出了静态奖励设置和敌意奖励设置的次线性遗憾界。研究者发现这些协议可以近似地优化面对单纯形的凸函数。
完成下面两步后,将自动完成登录并继续当前操作。