本文提出了CMTA方法,通过对比学习和时间注意力来解决多任务强化学习方法的限制。实验结果表明CMTA优于单独学习每个任务,并在基准上取得了显著的性能改进。
完成下面两步后,将自动完成登录并继续当前操作。