小红花·文摘

我们提出了一个通用的神经网络架构，该架构由任务无关的组件组成，实现了在 ImageNav 和 ObjectNav 任务上的最新成果，无需任务特定的模块。模型基于自监督学习和视觉变压器的预训练模型构建，在ViT修补表示上操作压缩层以保留空间信息，并改进策略训练。这些改进使我们首次在视觉导航任务中展现了正向编放律。