超越裸露询问:使用 3D 场景图进行开放词汇物体检索
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种开放词汇的3D场景图(OVSG),用于将实体与自由文本查询关联。OVSG支持上下文感知的实体定位,能够处理复杂查询。实验证明,OVSG在语义定位方面的性能超越了以往技术,并在机器人导航和操作实验中得到实际应用。
🎯
关键要点
-
介绍了一种开放词汇的3D场景图(OVSG),用于将实体与自由文本查询关联。
-
OVSG支持上下文感知的实体定位,处理复杂查询。
-
与传统的基于语义的物体定位方法不同,OVSG允许自由文本输入和开放词汇查询。
-
通过ScanNet数据集和自采集数据集的比较实验,OVSG在性能上超越了以往技术。
-
OVSG在真实世界的机器人导航和操作实验中得到了实际应用。
🏷️
标签
➡️