基于深度上下文多臂赌博算法的 5G 毫米波网络高能效休眠模式优化
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究开发了一种多智能体强化学习算法,用于降低多基站多小区网络的能耗并提高服务质量。该算法通过协作基站控制策略,在低流量小时内减少了约8.7%的功耗,在高流量小时内提高了约19%的能源效率。
🎯
关键要点
- 开发了一种多智能体强化学习算法,旨在降低多基站多小区网络的能耗并提高服务质量。
- 算法通过对多个大规模 MIMO 基站的多级高级休眠模式和天线切换进行决策。
- 该问题被建模为分散式部分可观察马尔可夫决策过程 (DEC-POMDP),以实现基站之间的协作。
- 设计了多智能体近端策略优化 (MAPPO) 算法来学习协作基站控制策略。
- 提出了 MAPPO - 邻近策略的改进版本以增强可扩展性。
- 仿真结果显示,MAPPO 智能体相比基准策略表现更佳。
- 在低流量小时内,MAPPO - 邻近策略减少了约 8.7% 的功耗。
- 在高流量小时内,MAPPO - 邻近策略提高了约 19% 的能源效率。
➡️