小红花·文摘

本文介绍了一种新型机器人操作方法，利用物体运动学习和模拟运动演示奖励（SLDRs），通过强化学习提高多物体堆放和非刚性物体操作的成功率。研究还提出了中继策略学习、导航机器人自主移动策略NavACL和基于示教引导的强化学习等方法，显著提升了学习效率和任务执行能力。