超越裸露询问:使用 3D 场景图进行开放词汇物体检索

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种开放词汇的3D场景图(OVSG),用于将实体与自由文本查询关联。OVSG支持上下文感知的实体定位,能够处理复杂查询。实验证明,OVSG在语义定位方面的性能超越了以往技术,并在机器人导航和操作实验中得到实际应用。

🎯

关键要点

  • 介绍了一种开放词汇的3D场景图(OVSG),用于将实体与自由文本查询关联。

  • OVSG支持上下文感知的实体定位,处理复杂查询。

  • 与传统的基于语义的物体定位方法不同,OVSG允许自由文本输入和开放词汇查询。

  • 通过ScanNet数据集和自采集数据集的比较实验,OVSG在性能上超越了以往技术。

  • OVSG在真实世界的机器人导航和操作实验中得到了实际应用。

➡️

继续阅读