MICRACLE: 人类启发的移动机器人导航的逆强化学习和课程学习模型

通过使用游戏化学习收集刺激驱动的人类导航数据并应用深度逆最大熵强化学习模型，我们提出了一种解决方案 MIRACLE，通过减少在示范能力上的依赖，可以训练具备人类感知的移动机器人，在紧急情况下像人类一样导航从而提高其救生能力。

本文提出了一个新的学习框架，使机器人能够通过学习和推理环境模型，成功遵循自然语言路线指令。该算法利用空间和语义信息学习环境度量和语义属性的分布，并将自然语言指令解释为预期行为的分布。通过推理地图和状态分布，使用新型置信空间规划器直接求解策略，在可声控轮椅上评估了该框架。结果表明，该算法能够成功遵循新颖扩展环境中的自然语言路线指令。