基于视觉的追逐 - 逃避机器人策略学习
原文中文,约400字,阅读约需1分钟。发表于: 。将从追逐 - 逃避互动中学习战略性机器人行为这一实际约束下的问题转化为一个监督学习问题,其中完全可观测的机器人策略为部分可观测的机器人策略生成监督信号,并发现这个监督信号的质量依赖于两个关键因素:逃避者行为的多样性与最优性的平衡以及完全可观测策略中的建模假设的强度。在野外的追逐 - 逃避互动中,我们部署了这个策略在一台带有 RGB-D...
这篇文章将机器人行为问题转化为监督学习问题,并发现监督信号的质量依赖于逃避者行为的多样性与最优性的平衡以及完全可观测策略中的建模假设的强度。在野外实验中,使用带有RGB-D相机的四足机器人部署了这个策略,机器人在不确定时努力收集信息,预测意图,并提前预判以拦截。