连续的视觉语言导航中的前瞻探索及神经辐射表示
原文中文,约300字,阅读约需1分钟。发表于: 。利用预训练的分层神经辐射表示模型产生多层次语义特征,用于预测未来环境,提出前瞻导航模型以构建可导航的未来路径树并通过有效的并行评估选择最佳路径。
本文研究了Vision-and-Language Navigation模型中的环境偏差问题,发现底层视觉外观对代理模型有直接影响。通过使用较少底层视觉信息的语义表示形式,能够更好地推广到未见过的测试环境中。实验证明,这种探索性语义特征能够显著降低已看和未见之间的性能差距,并与最先进模型具有竞争力。