该研究提出了一种基于分层一致性的多智能体强化学习框架,通过对比学习促进智能体之间的全局一致性,实现协同行为而无需直接通信。该框架允许智能体从地方观测中形成全局一致性,并通过自适应注意机制调整每个一致性层的影响,以适应特定任务的要求。实验结果表明,该框架在多机器人系统中取得了显著的进展。
完成下面两步后,将自动完成登录并继续当前操作。