小红花·文摘

本研究提出了SMAC-HARD基准，旨在解决多智能体强化学习中对手策略多样性不足的问题。通过支持可定制的对手策略和无监督自我对弈，增强了训练的鲁棒性，促进了多智能体强化学习算法的发展。