该文章介绍了基于图像的深度强化学习中的数据增强技术,并提出了一种名为切线传递的正则化项。该方法在多个领域中验证了其有效性,取得了最先进的性能,并展现了更高的样本效率和更好的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。