小红花·文摘

本研究提出了一种新颖的组合方法DSE-扩散分数平衡，旨在提高机器人学习新技能的样本效率。该方法结合基础政策先验，实现了少样本学习，并有效建模示范数据分布。实验结果表明，该方法显著提升了技能学习的性能，成功教授机器人新轨迹。