小红花·文摘

本文提出了一种基于图卷积强化学习的多代理方法，利用关系内核捕获代理间的相互作用，通过卷积层学习合作特征，并采用时间关系正则化以保持一致性。实验结果表明，该方法在多种合作场景中显著优于现有技术。