移动机器人的人类干预数据高效学习
📝
内容提要
本研究针对传统学习方法(如模仿学习和强化学习)在移动机器人任务中对大量数据和复杂奖励函数的需求问题,提出了一种在线人类干预学习方法PVP4Real。该方法通过在线人类干预和演示进行实时策略学习,显著提高了数据效率和训练安全性,实验表明其在实际机器人任务中具有良好的应用前景。
➡️
本研究针对传统学习方法(如模仿学习和强化学习)在移动机器人任务中对大量数据和复杂奖励函数的需求问题,提出了一种在线人类干预学习方法PVP4Real。该方法通过在线人类干预和演示进行实时策略学习,显著提高了数据效率和训练安全性,实验表明其在实际机器人任务中具有良好的应用前景。