本文提出了一种基于知识辅助的深度强化学习算法,用于设计5G移动通信网络中的无线调度器。该算法结合在线和离线学习,显著提高了收敛速度和QoS性能,减少了30%~50%的数据包丢失率。实验结果表明,该方法在调度和资源分配方面优于现有方案,具有良好的应用前景。
完成下面两步后,将自动完成登录并继续当前操作。