小红花·文摘

该研究提出了OG-MARL数据集和算法框架，旨在填补离线多智能体强化学习（MARL）领域的基准和评估方法空白。研究分析了现有评估方法的不足，强调可复制性的重要性，并提出标准化的性能评估协议，以提高未来研究的可信度。