小红花·文摘

本文提出了一种基于知识辅助的深度强化学习算法，用于设计5G移动通信网络中的无线调度器。该算法结合在线和离线学习，显著提高了收敛速度和QoS性能，减少了30%~50%的数据包丢失率。实验结果表明，该方法在调度和资源分配方面优于现有方案，具有良好的应用前景。