BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

IVLMap: 消费级机器人导航的实例感知视觉语言定位

通过构建语义空间地图和使用大型语言模型的强大推理能力,我们提出了一种新的方法 IVLMap,使机器人能够获得实例级和属性级的语义映射,从而实现了精确定位和零 - shot 端到端导航任务的能力,并在导航准确性上实现了 14.4% 的平均改进。

NaVid是一个基于视频的大型视觉语言模型,通过动态的视频流输入,实现了最先进水平的导航性能。它解决了里程计噪声和模拟环境到真实环境之间的缺陷,并有效地利用机器人的历史观察作为决策和指令遵循的时空背景。

NaVid 导航性能 机器人 模拟环境 视频 里程计噪声

相关推荐 去reddit讨论

热榜 Top10

Dify.AI
Dify.AI
eolink
eolink
LigaAI
LigaAI
观测云
观测云

推荐或自荐