小红花·文摘

QMIX是一种基于价值的多智能体强化学习方法，支持集中训练和分散策略。研究中提出了QTRAN和GraphMIX等新算法，克服了现有方法的局限性，尤其在非合作游戏中表现优越。DFAC框架结合了分布式强化学习与价值函数分解，提升了多智能体环境的表现。最新的POWQMIX算法通过优化联合动作权重，进一步提高了训练效果。