我们使用强化学习代理在模拟中训练大量离线学习数据,以实现真实世界机器人任务。我们评估了开源离线强化学习算法,并提供了可重现的实验设置。
我们使用强化学习代理在模拟中训练的两个任务的离线学习数据,提出了一个基准,以实现真实世界机器人任务。我们评估了开源离线强化学习算法,并提供了可重现的实验设置。
完成下面两步后,将自动完成登录并继续当前操作。