本文介绍了基于大规模语言模型(LLM)和强化学习(RL)的新方法,如KSL、BLINDER和Statler。这些方法通过自我监督、状态表示和任务条件化,提高了任务成功率和样本效率,增强了机器人推理和决策能力,展示了LLM在RL中的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。