离线多智能体强化学习(MARL)研究评估存在不一致性问题,通过比较前人工作发现基准方法在大多数任务中能达到最优结果。提出了简便易行的评估标准方法,纠正了前人工作中的缺陷,提高了离线MARL的实证科学水平。
离线多智能体强化学习(MARL)研究评估存在不一致性问题。通过比较前人工作,发现简单的基准方法在大多数任务中能达到最优结果。提出了简便易行的评估标准方法,纠正了前人工作中的缺陷,提高了离线MARL的实证科学水平。
完成下面两步后,将自动完成登录并继续当前操作。