在未知的动态环境中使用三维语义地图进行开放词汇的移动操作

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

我们提出了基于学习的知识表示方法,使用潜在的组合语义嵌入z*作为查询空间语义记忆。实验证明z*能够表示多个语义和高维嵌入,并在COCO-Stuff数据集上取得了较好的分割性能。

🎯

关键要点

  • 提出了基于学习的知识表示方法,使用潜在的组合语义嵌入 z* 作为查询空间语义记忆。
  • 证明了 z* 可以通过梯度下降的迭代优化被发现。
  • z* 能够表示由 SBERT 编码的多达 10 个语义和高维嵌入的多达 100 个语义。
  • 在 COCO-Stuff 数据集上,经过密集 VLM 训练的 z* 针对 181 个重叠语义取得了 42.23 的 mIoU。
  • 相比于流行的 SOTA 模型,z* 改进了 3.48 的 mIoU 的传统非重叠开放词汇分割性能。
➡️

继续阅读