小红花·文摘

该研究提出了FCMNet通信框架，利用方向性递归神经网络的隐藏状态作为通信信息，实现了一个既能学习多跳通信协议，又能让代理团队制定决策的共同分散式智策略。FCMNet在StarCraft II微操作任务中表现出较强的鲁棒性，超越了现有的通信强化学习方法，并在一些任务中优于价值分解方法。它还能应对通信干扰情况，有望应用于实际机器人任务。