该研究提出了一种基准方法,使用强化学习代理在模拟中训练的离线学习数据,实现真实世界机器人任务。研究评估了开源离线强化学习算法,并提供了可重现的实验设置。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: