语言扩展室内 SLAM(LEXIS):实时视觉场景理解的多功能系统
原文中文,约300字,阅读约需1分钟。发表于: 。LEXIS 是一种实时室内同时定位与地图构建系统,通过利用大规模语言模型的开放词汇特性,实现了场景理解和地点识别的统一方法。该系统通过建立环境的拓扑 SLAM 图,并将 CONTRASTIVE LANGUAGE-IMAGE PRETRAINING(CLIP)特征嵌入图节点,实现了灵活的房间分类和划分,并在房间为中心的地点识别方面取得了优于最先进技术的性能。
LEXIS是一种实时室内同时定位与地图构建系统,利用大规模语言模型的开放词汇特性,实现了场景理解和地点识别的统一方法。该系统通过建立环境的拓扑SLAM图,并将CLIP特征嵌入图节点,实现了灵活的房间分类和划分,并在房间为中心的地点识别方面取得了优于最先进技术的性能。