小红花·文摘

本研究提出三种适用于合作、对抗和混合环境的演员-评论家算法，解决多智能体强化学习中去中心化训练的不足。通过引入网络通信和替代策略，去中心化算法在降低计算成本的同时，能与原始MADDPG算法达到相似效果，尤其在代理数量较多时更为明显。

完全去中心化的MADDPG与网络化代理

BriefGPT - AI 论文速递 ·

本文提出了一种基于MA-DDPG框架的多决策者预编码优化方法，解决了多维动作空间下的相位歧义问题。模拟结果表明，该方法在MISO IFC系统中接近最优，首次验证了MA-DDPG框架在多用户系统中的有效性。此外，研究还探讨了深度学习在智能反射表面和V2X通信中的应用，展示了其在信道估计和资源分配中的优势。

双动态 ISAC 预编码在车载网络中的应用：基于约束深度强化学习（CDRL）方法

BriefGPT - AI 论文速递 ·

【多智能体强化学习】MADDPG 论文笔记

文艺数学君 ·