Goal-oriented Transmission Scheduling: Structure-guided Unified Dual Policy Method of Deep Reinforcement Learning

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种结构引导的统一双重策略深度强化学习算法(SUDO-DRL),旨在提高多设备、多信道系统中的调度效率。该算法结合了政策训练的稳定性与非政策方法的样本效率,显著提升了系统性能,适应了大规模调度需求。

🎯

关键要点

  • 本研究提出了一种结构引导的统一双重策略深度强化学习算法(SUDO-DRL)。
  • SUDO-DRL旨在提高多设备、多信道系统中的调度效率。
  • 该算法结合了政策训练的稳定性与非政策方法的样本效率。
  • 研究分析了最优调度问题的结构特性,显著提升了系统性能。
  • SUDO-DRL适应了大规模调度需求。
➡️

继续阅读