GOV-NeSF: 通用开放词汇神经语义领域
原文中文,约300字,阅读约需1分钟。发表于: 。通过引入 Generalizable Open-Vocabulary Neural Semantic Fields (GOV-NeSF),我们提出了一种对 3D 场景进行泛化的隐式表示方法,显著提升了 2D 和 3D 开放词汇语义分割的性能,同时消除了对语义标签或深度先验的需求,有效地在不进行微调的情况下跨场景和数据集进行泛化。
本文介绍了一种开放词汇的3D场景图(OVSG),用于将实体与自由文本查询关联。OVSG支持上下文感知的实体定位,能够处理复杂查询。实验证明OVSG在语义定位方面性能超越以往技术,同时在机器人导航和操作实验中也有实际应用。