本研究探究了多智能体强化学习中的泛化性挑战,并通过度量智能体间的交互强度证实,训练中采用更多多样的协同智能体可以提高自我智能体的泛化能力。同时,基于交互强度的资源分配方法也可以在有限的计算预算下获得更高的性能。
完成下面两步后,将自动完成登录并继续当前操作。