该研究提出了一种基于分层一致性的多智能体强化学习框架,通过对比学习促进智能体之间的全局一致性,实现协同行为而无需直接通信。该框架允许智能体从地方观测中形成全局一致性,并通过自适应注意机制调整每个一致性层的影响,以适应特定任务的要求。实验结果表明,该框架在多机器人系统中取得了显著的进展。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: