小红花·文摘

本文提出了一种结合模仿和强化学习的混合模型，以提高机器人在新环境中的技能学习和适应能力。通过高斯混合回归，机器人能够精确跟踪动态系统中的关键点，并有效应对场景变化。此外，研究探讨了利用感知运动基元解决复杂操作问题的方法，提升了无模型强化学习的样本效率。实验结果显示，该方法在机械手臂操作任务中表现优异。