小红花·文摘

该研究提出了一种基于分层一致性的多智能体强化学习框架，通过对比学习促进智能体之间的全局一致性，实现协同行为而无需直接通信。该框架允许智能体从地方观测中形成全局一致性，并通过自适应注意机制调整每个一致性层的影响，以适应特定任务的要求。实验结果表明，该框架在多机器人系统中取得了显著的进展。