本研究提出ReLIC,一种用于具身人工智能的强化学习方法,利用64,000步上下文经验帮助智能体快速适应新环境。该方法结合部分更新策略和Sink-KV机制,在多目标导航任务中表现优异,超越多种元强化学习基线,并展现模仿学习能力。
完成下面两步后,将自动完成登录并继续当前操作。