小红花·文摘

该论文扩展了“语言世界”基准，支持在模拟机器人环境中使用自然语言进行查询和脚本技能。通过与元世界任务集的比较，展示了大型语言模型与深度强化学习方法的差异。提出的“计划条件行为克隆”方法能够通过端到端演示优化高级计划，通常只需一个演示即可实现任务泛化。

视觉预测器：利用神经符号谓词学习抽象世界模型以进行机器人规划

BriefGPT - AI 论文速递 ·

该论文扩展了“语言世界”基准，支持在模拟机器人环境中使用自然语言进行查询和脚本技能。通过与元世界任务集的比较，分析了大型语言模型与深度强化学习的差异。提出的“计划条件行为克隆”方法能够通过少量示例优化高级计划行为，展现出强大的性能。

在开放世界领域创建和修复机器人程序

BriefGPT - AI 论文速递 ·

该论文扩展了“语言世界”基准，支持在模拟机器人环境中使用自然语言进行查询和技能描述。通过与元世界任务集的对比，分析大型语言模型与深度强化学习的差异。提出了一种“计划条件行为克隆”方法，在少样本情况下表现优异。语言世界已开源。

CLIMB：基于语言指导的任务规划持续学习框架

BriefGPT - AI 论文速递 ·

该论文介绍了一个名为“语言世界”的元世界基准的扩展，允许使用大型语言模型在模拟机器人环境中使用自然语言查询和脚本技能。论文还介绍了一种名为“Plan Conditioned Behavioral Cloning”的方法，可以通过端到端演示来优化高级计划的行为。使用语言世界，PCBC能够在少样本情况下实现强大的性能。

通过语言优化进行政策适应：对少样本模仿任务的分解

BriefGPT - AI 论文速递 ·