Goal-oriented Transmission Scheduling: Structure-guided Unified Dual Policy Method of Deep Reinforcement Learning
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种结构引导的统一双重策略深度强化学习算法(SUDO-DRL),旨在提高多设备、多信道系统中的调度效率。该算法结合了政策训练的稳定性与非政策方法的样本效率,显著提升了系统性能,适应了大规模调度需求。
🎯
关键要点
- 本研究提出了一种结构引导的统一双重策略深度强化学习算法(SUDO-DRL)。
- SUDO-DRL旨在提高多设备、多信道系统中的调度效率。
- 该算法结合了政策训练的稳定性与非政策方法的样本效率。
- 研究分析了最优调度问题的结构特性,显著提升了系统性能。
- SUDO-DRL适应了大规模调度需求。
➡️