本研究提出了一种新颖的组合方法DSE-扩散分数平衡,旨在提高机器人学习新技能的样本效率。该方法结合基础政策先验,实现了少样本学习,并有效建模示范数据分布。实验结果表明,该方法显著提升了技能学习的性能,成功教授机器人新轨迹。
完成下面两步后,将自动完成登录并继续当前操作。