传感器：通过主动感知模仿第三人称专家的行为

通过引入主动传感器技术，本论文在视觉模仿学习 (IL) 的场景中解决了代理人与专家视角不对齐的问题，提出了基于模型的传感器模仿器 (SENSOR) 来自动调整代理人的视角以匹配专家，实验证明 SENSOR 可以有效地模拟专家的视角和策略，并超过大多数基准方法。

提出了一种名为模仿学习（ItorL）的新主题，旨在基于非常有限的专家示范实现即时重构模仿策略，用于不同的未知任务，无需任何额外的调整。通过将模仿学习集成到强化学习范式中，设计了 Demo-Attention Actor-Critic（DAAC）来解决 ItorL 问题，并为模仿者策略设计了一种基于示范的注意力架构，可以通过自适应追踪示范中的适当状态有效地输出模仿动作。在新的导航基准和机器人环境中，展示出 DAAC 在已知和未知任务上均比之前的模仿方法有着显著的优势。

DAAC ItorL 传感器模仿学习注意力架构示范