稀疏八卦网络中公平时效性的基于学习的方案
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究探讨了分布式多臂赌博设置在流言传播模型中的应用,推导出了静态奖励设置和敌意奖励设置的次线性遗憾界。研究者发现这些协议可以近似地优化面对单纯形的凸函数。
🎯
关键要点
-
研究探讨了分布式多臂赌博设置在流言传播模型中的应用。
-
研究对象为内存受限的 n 个节点,每个节点在每个回合中选择 m 个手臂之一。
-
节点通过观察手臂的回报分布并与邻居通信来决定下一轮策略。
-
引入并分析了几族分散动力学,节点决策依赖于本地奖励和邻居奖励。
-
展示了分散动态的全局演化与零和乘性权重更新算法的联系。
-
开发了通用框架分析自然协议的种群水平遗憾。
-
推导出静态奖励设置和敌意奖励设置的次线性遗憾界。
-
证明这些协议可以近似优化面对单纯形的凸函数。
➡️