该研究提出了FCMNet通信框架,利用方向性递归神经网络的隐藏状态作为通信信息,实现了一个既能学习多跳通信协议,又能让代理团队制定决策的共同分散式智策略。FCMNet在StarCraft II微操作任务中表现出较强的鲁棒性,超越了现有的通信强化学习方法,并在一些任务中优于价值分解方法。它还能应对通信干扰情况,有望应用于实际机器人任务。
完成下面两步后,将自动完成登录并继续当前操作。