小红花·文摘

本文介绍了离线元强化学习（OMRL）中的任务表示学习问题，并提出了一种硬采样策略来学习任务上下文编码器。实验结果表明，该技术可以得到更强壮的任务表示和更好的测试性能。