小红花·文摘

本研究提出了一种新方法，通过将沟通问题分解为倾听和发言，利用智能体目标生成奖励信号，提升多智能体环境中的语言模型沟通能力。研究表明，该方法在复杂社交情境中显著提高了讨论质量和赢率。