MASK4D:4D 全景分割的掩码变换器

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

Mask4D是一种基于Transformer的LiDAR点云4D全景分割方法,能够直接预测语义实例及其时间关联,无需非学习关联策略。在SemanticKITTI测试集上,Mask4D取得了68.4 LSTQ的最优效果,相较于已发表的表现最佳方法提高了至少4.5%。

🎯

关键要点

  • Mask4D是一种基于Transformer的LiDAR点云4D全景分割方法。
  • 该方法能够直接预测语义实例及其时间关联,无需非学习关联策略。
  • 通过引入时空实例查询编码每个实例轨迹的语义和几何特性。
  • 从时空实例查询回归6DOF边界框参数以促进紧凑的空间预测。
  • 在SemanticKITTI测试集上,Mask4D取得了68.4 LSTQ的最优效果。
  • 相较于已发表的表现最佳方法,Mask4D提高了至少4.5%。
➡️

继续阅读