NAVCON: A Cognitively Inspired and Linguistically Grounded Corpus for Vision and Language Navigation
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了NAVCON,一个基于R2R和RxR数据集的大规模视觉语言导航语料库。研究引入了四个核心的认知和语言基础导航概念,并开发了生成自然语言导航指令的算法,评估了注释质量,对未来研究和应用具有重要意义。
🎯
关键要点
- NAVCON是一个基于R2R和RxR数据集的大规模视觉语言导航语料库。
- 研究引入了四个核心的认知和语言基础导航概念。
- 开发了生成自然语言导航指令的算法。
- 评估了注释质量,显示出良好的导航概念检测能力。
- 该研究对未来的研究和应用具有重要意义。
➡️