本文提出了一种基于图卷积强化学习的多代理方法,利用关系内核捕获代理间的相互作用,通过卷积层学习合作特征,并采用时间关系正则化以保持一致性。实验结果表明,该方法在多种合作场景中显著优于现有技术。
完成下面两步后,将自动完成登录并继续当前操作。