小红花·文摘

本文研究了协作多智能体强化学习系统的鲁棒性，提出了ROMANCE和MA3C等新方法以应对对抗攻击。这些方法在多项基准测试中表现优异，增强了智能体的防御能力和通信策略的鲁棒性。

BriefGPT - AI 论文速递 ·

本文提出了一种基于信息瓶颈的无监督方法，用于探索稀疏的多智能体增强学习中的社交通信情境。该方法可以捕捉复杂性和任务特定效用，并开发出一种自然语言灵感的信息组成的词汇表，通过社交影子来学习通信策略。

BriefGPT - AI 论文速递 ·