AIxiv专栏促进学术交流,浙江大学与南栖仙策推出SMAC-HARD环境,支持可编辑对手策略,提升多智能体强化学习的挑战性。研究表明,传统算法在此环境中难以维持高胜率,突显策略转移的局限性。希望SMAC-HARD为MARL社区提供新的研究平台。
本研究提出了SMAC-HARD基准,旨在解决多智能体强化学习中对手策略多样性不足的问题。通过支持可定制的对手策略和无监督自我对弈,增强了训练的鲁棒性,促进了多智能体强化学习算法的发展。
完成下面两步后,将自动完成登录并继续当前操作。