本研究提出了SMAC-HARD基准,旨在解决多智能体强化学习中对手策略多样性不足的问题。通过支持可定制的对手策略和无监督自我对弈,增强了训练的鲁棒性,促进了多智能体强化学习算法的发展。
完成下面两步后,将自动完成登录并继续当前操作。