本研究提出了一种即时策略,通过图表示引入归纳偏差,解决机器人领域的上下文模仿学习问题,快速学习多种日常任务,并为跨实体和零样本转移奠定基础。
本研究提出了SkillMimicGen(SkillGen),旨在解决机器人操控中模仿学习对大数据集需求的高成本问题。该系统通过少量人类演示生成数据集,显著提升了数据生成和策略学习性能,成功生成超过24,000个演示,实现了零样本的模拟到真实转移。
研究者构建了Cline数据集,包含16,642个英语-印地语混合文本句子,用于混合文本生成的质量控制。实验证明,基于混合代码指标训练的多层感知机模型表现更佳。研究者还进行了零样本转移可接受性判断,超过了随机基线。研究者公开发布了相关数据集、训练检查点、混合文本语料库和数据生成以及模型训练的代码。
完成下面两步后,将自动完成登录并继续当前操作。