我们提出了一个通用的神经网络架构,该架构由任务无关的组件组成,实现了在 ImageNav 和 ObjectNav 任务上的最新成果,无需任务特定的模块。模型基于自监督学习和视觉变压器的预训练模型构建,在ViT修补表示上操作压缩层以保留空间信息,并改进策略训练。这些改进使我们首次在视觉导航任务中展现了正向编放律。
完成下面两步后,将自动完成登录并继续当前操作。