本研究探讨了多智能体强化学习(MARL)在不相关并行机器调度中的应用,并比较了MARL与单智能体算法的表现。结果表明,多智能体PPO算法在可扩展性方面表现良好,但在协作学习上面临挑战,为调度优化提供了新视角。
完成下面两步后,将自动完成登录并继续当前操作。