增强6G卫星网络中的频谱效率:基于异步联合逆强化学习的GAIL驱动的政策学习
📝
内容提要
本研究解决了传统强化学习方法在无线网络优化中依赖手动设计奖励函数的问题,提出了一种基于GAIL的政策学习方法,能够自动学习奖励函数,并结合异步联合学习以实现多卫星系统的协同优化。研究结果表明,该方法在收敛速度和奖励值方面较传统方法提高了14.6%,为6G NTN优化建立了新的基准。
🏷️
标签
➡️