Soft-QMIX:整合最大熵用于单调值函数分解
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
提出了QMIX的增强算法,解决了QMIX的探索策略问题,并保证了局部最优动作与全局最优动作的一致性。该方法在理论和实验上得到了验证,并在矩阵游戏、多智能体粒子环境和SMAC-v2中表现出领先水平的性能。
🎯
关键要点
- 提出了QMIX的增强算法
- 通过最大熵强化学习框架引入额外的本地Q值学习方法
- 解决了QMIX的探索策略问题
- 保证了局部最优动作与全局最优动作的一致性
- 该方法在理论和实验上得到了验证
- 在矩阵游戏、多智能体粒子环境和SMAC-v2中表现出领先水平的性能
🏷️
标签
➡️