本文介绍了MetaDrive驾驶仿真平台,用于研究机器自我行驶的强化学习算法。通过构建各种任务和基准测试,评估了机器在不同场景下的行为,并提出了安全强化学习算法和多智能体强化学习算法的基准测试。训练循环的增加可以提高机器的推广能力。
完成下面两步后,将自动完成登录并继续当前操作。