小红花·文摘

这篇文章将机器人行为问题转化为监督学习问题，并发现监督信号的质量依赖于逃避者行为的多样性与最优性的平衡以及完全可观测策略中的建模假设的强度。在野外实验中，使用带有RGB-D相机的四足机器人部署了这个策略，机器人在不确定时努力收集信息，预测意图，并提前预判以拦截。