基于深度学习的通信系统动态用户效用需求资源分配器
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一种针对协作无线电网络的分布式深度强化学习资源分配技术,能够在非平稳环境下迭代地收敛于平衡政策,且无需与其他代理协调配合。
🎯
关键要点
- 提出了一种分布式的深度强化学习资源分配技术,针对协作无线电网络的多智能体环境。
- 该算法能够在非平稳环境下迭代收敛于平衡政策,无需与其他代理协调。
- 仿真结果显示,该技术的学习性能比基于 Q 表的 Q 学习算法更快。
- 在足够长的学习时间内,99% 的情况下能够找到最优策略。
- 与基于表格的实现相比,DQL 方法只需不到一半的学习步骤即可实现相同性能。
- 证明了在未协调交互的多无线电情景中,标准的单智能体深度强化学习方法可能无法收敛。
➡️