稀疏八卦网络中公平时效性的基于学习的方案

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该研究探讨了分布式多臂赌博设置在流言传播模型中的应用,推导出了静态奖励设置和敌意奖励设置的次线性遗憾界。研究者发现这些协议可以近似地优化面对单纯形的凸函数。

🎯

关键要点

  • 研究探讨了分布式多臂赌博设置在流言传播模型中的应用。

  • 研究对象为内存受限的 n 个节点,每个节点在每个回合中选择 m 个手臂之一。

  • 节点通过观察手臂的回报分布并与邻居通信来决定下一轮策略。

  • 引入并分析了几族分散动力学,节点决策依赖于本地奖励和邻居奖励。

  • 展示了分散动态的全局演化与零和乘性权重更新算法的联系。

  • 开发了通用框架分析自然协议的种群水平遗憾。

  • 推导出静态奖励设置和敌意奖励设置的次线性遗憾界。

  • 证明这些协议可以近似优化面对单纯形的凸函数。

➡️

继续阅读