认知无线电应用的多智能体强化学习测试平台
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种深度强化学习资源分配技术,适用于协作无线电网络,能够在非平稳环境中有效收敛至平衡策略。仿真结果表明,该技术的学习性能优于传统Q学习,99%的情况下能找到最优策略,学习步骤减少了一半。
🎯
关键要点
- 提出了一种分布式的深度强化学习资源分配技术,适用于协作无线电网络。
- 该技术能够在非平稳环境中有效收敛至平衡策略,无需与其他代理协调。
- 仿真结果显示,该技术的学习性能优于传统的基于Q表的Q学习算法。
- 在99%的情况下,该技术能够找到最优策略。
- 与基于表格的实现相比,DQL方法只需不到一半的学习步骤即可实现相同性能。
- 证明了在未协调交互的多无线电情景中,标准的单智能体深度强化学习方法可能无法收敛。
➡️