该研究提出了OG-MARL数据集和算法框架,旨在填补离线多智能体强化学习(MARL)领域的基准和评估方法空白。研究分析了现有评估方法的不足,强调可复制性的重要性,并提出标准化的性能评估协议,以提高未来研究的可信度。
完成下面两步后,将自动完成登录并继续当前操作。