小红花·文摘

本文提出了一种基于信息瓶颈的无监督方法，用于探索稀疏的多智能体增强学习中的社交通信情境。该方法可以捕捉复杂性和任务特定效用，并开发出一种自然语言灵感的信息组成的词汇表，通过社交影子来学习通信策略。