研究将战略性机器人行为学习转化为监督学习问题,通过四足机器人的实验发现监督信号质量与逃避者行为多样性、最优性和建模假设强度相关。机器人在追逐-逃避互动中表现出创造力,努力收集信息并预测意图以提前拦截。
本文讨论了将追逐-逃避互动中的机器人行为问题转化为监督学习问题的方法。通过使用可观测的机器人策略生成监督信号,研究发现监督信号的质量与逃避者行为的多样性和最优性的平衡以及建模假设的强度有关。实验中,他们在一台带有RGB-D相机的四足机器人上部署了这个策略,并成功应对了各种挑战。
完成下面两步后,将自动完成登录并继续当前操作。