小红花·文摘

本文介绍了基于大规模语言模型（LLM）和强化学习（RL）的新方法，如KSL、BLINDER和Statler。这些方法通过自我监督、状态表示和任务条件化，提高了任务成功率和样本效率，增强了机器人推理和决策能力，展示了LLM在RL中的应用潜力。