小红花·文摘

本研究提出了一种记忆增强方法，旨在解决强化学习在训练与实际任务之间的表现差异。该方法通过任务结构化和记忆机制实现上下文策略适应，展现出零-shot 泛化能力，并保持高样本效率。