本文介绍了OfflineMania,一个基于Unity 3D的离线强化学习研究环境,模拟单人赛车游戏。研究提出了多种算法,如Sim-OPRL和Optimal Transport Reward(OTR),以提升离线强化学习的性能和鲁棒性,并展示了其在不同环境中的有效性和潜力。
完成下面两步后,将自动完成登录并继续当前操作。