该文介绍了一种基于强化学习的图像到图像翻译框架,使用轻量级模型逐步转换源图像到目标图像,并引入次级策略和计划的概念来解决高维连续状态和动作空间的问题。同时,采用特定任务的辅助学习策略以稳定训练过程并提升性能。
完成下面两步后,将自动完成登录并继续当前操作。