改进社交机器人导航的强化学习训练方式
原文中文,约300字,阅读约需1分钟。发表于: 。自主移动机器人在人类空间中导航必须遵守社会规范。本研究提出了一种使用课程学习来改善强化学习社交导航方法的泛化性能的方法。通过使用多种环境类型和多种动力学模型对行人进行建模,逐步增加训练的多样性和难度。研究结果表明,与之前的训练方法相比,使用课程学习进行训练可以取得更好的泛化性能。此外,我们还验证了训练方法在比训练中使用的更大更拥挤的测试环境中的有效性,从而对模型的性能进行更有意义的衡量。
本研究提出了一种使用课程学习来改善强化学习社交导航方法的泛化性能的方法。研究结果表明,使用课程学习进行训练可以取得更好的泛化性能,并验证了训练方法在更大更拥挤的测试环境中的有效性。