基于深度上下文多臂赌博算法的 5G 毫米波网络高能效休眠模式优化

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该研究开发了一种多智能体强化学习算法,用于降低多基站多小区网络的能耗并提高服务质量。该算法通过协作基站控制策略,在低流量小时内减少了约8.7%的功耗,在高流量小时内提高了约19%的能源效率。

🎯

关键要点

  • 开发了一种多智能体强化学习算法,旨在降低多基站多小区网络的能耗并提高服务质量。
  • 算法通过对多个大规模 MIMO 基站的多级高级休眠模式和天线切换进行决策。
  • 该问题被建模为分散式部分可观察马尔可夫决策过程 (DEC-POMDP),以实现基站之间的协作。
  • 设计了多智能体近端策略优化 (MAPPO) 算法来学习协作基站控制策略。
  • 提出了 MAPPO - 邻近策略的改进版本以增强可扩展性。
  • 仿真结果显示,MAPPO 智能体相比基准策略表现更佳。
  • 在低流量小时内,MAPPO - 邻近策略减少了约 8.7% 的功耗。
  • 在高流量小时内,MAPPO - 邻近策略提高了约 19% 的能源效率。
➡️

继续阅读