小红花·文摘

本文提出了MASER方法，针对稀疏奖励的多代理强化学习问题，显著优于其他算法。MASER通过生成子目标和奖励机器，提高学习效率和策略可解释性，适用于复杂环境中的合作任务。实验结果表明，该方法在多智能体领域表现出色，具有良好的研究前景。