连续的视觉语言导航中的前瞻探索及神经辐射表示
本文研究了Vision-and-Language Navigation模型中的环境偏差问题,发现底层视觉外观对代理模型有直接影响。通过使用较少底层视觉信息的语义表示形式,能够更好地推广到未见过的测试环境中。实验证明,这种探索性语义特征能够显著降低已看和未见之间的性能差距,并与最先进模型具有竞争力。
原文中文,约300字,阅读约需1分钟。
本文研究了Vision-and-Language Navigation模型中的环境偏差问题,发现底层视觉外观对代理模型有直接影响。通过使用较少底层视觉信息的语义表示形式,能够更好地推广到未见过的测试环境中。实验证明,这种探索性语义特征能够显著降低已看和未见之间的性能差距,并与最先进模型具有竞争力。