本文介绍了一种开放词汇的3D场景图(OVSG),通过CLIP特征空间实现上下文感知的实体定位,支持自由文本查询。研究表明,OVSG在机器人导航和操作中表现优越,能够有效推断3D结构和检索图像,提升3D场景理解的性能。
本文介绍了一种开放词汇的3D场景图(OVSG),用于将实体与自由文本查询关联,支持上下文感知的实体定位。实验表明,OVSG在机器人导航和操作中表现优越,能够处理复杂的空间和语义推理任务,显著提高了3D场景图的生成质量。
本文介绍了一种开放词汇的3D场景图(OVSG),用于将实体与自由文本查询关联。OVSG支持上下文感知的实体定位,性能超越以往的语义定位技术。在机器人导航和操作实验中有实际应用。
OVSG是一种开放词汇的3D场景图,支持上下文感知的实体定位和自由文本查询。实验证明,OVSG性能优于以前的语义定位技术,并在机器人导航和操作实验中得到了实际应用。
完成下面两步后,将自动完成登录并继续当前操作。