小红花·文摘

本研究探讨了多智能体强化学习（MARL）在不相关并行机器调度中的应用，并比较了MARL与单智能体算法的表现。结果表明，多智能体PPO算法在可扩展性方面表现良好，但在协作学习上面临挑战，为调度优化提供了新视角。