Efficient Communication for Federated Regret Minimization: Federated UCBVI for Heterogeneous Agents
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本文提出了一种联邦上置信界值迭代算法(Fed-UCBVI),旨在解决联邦学习中的后悔最小化问题。该算法在异构代理环境中具有低通信复杂度和高学习效率。
🎯
关键要点
- 提出了一种联邦上置信界值迭代算法(Fed-UCBVI)。
- 该算法旨在解决联邦学习中的后悔最小化问题。
- 在异构代理环境中,该算法具有低通信复杂度和高学习效率。
- 增加代理数量时,通信复杂度仅小幅增加。
- 提高了多代理场景下的学习效率。
➡️