小红花·文摘

本文介绍了基于深度神经网络的强化学习在机器人抓取任务中的应用，以及利用生成模型进行图像仿真与真实环境之间的过渡。通过 RL-scene 一致性损失实现了无监督领域转换，训练出了 RL-CycleGAN 模型，表现出了模拟到现实环境下最优的效果。