本文提出了MASER方法,针对稀疏奖励的多代理强化学习问题,显著优于其他算法。MASER通过生成子目标和奖励机器,提高学习效率和策略可解释性,适用于复杂环境中的合作任务。实验结果表明,该方法在多智能体领域表现出色,具有良好的研究前景。
完成下面两步后,将自动完成登录并继续当前操作。