小红花·文摘 - 小红花技术领袖俱乐部

我们使用强化学习代理在模拟中训练大量离线学习数据，以实现真实世界机器人任务。我们评估了开源离线强化学习算法，并提供了可重现的实验设置。

改进带有不准确模拟器的离线强化学习

BriefGPT - AI 论文速递 ·

我们使用强化学习代理在模拟中训练的两个任务的离线学习数据，提出了一个基准，以实现真实世界机器人任务。我们评估了开源离线强化学习算法，并提供了可重现的实验设置。

AD4RL：用基于价值的数据集进行离线强化学习的自动驾驶基准

BriefGPT - AI 论文速递 ·