SparseOcc(稀疏隐含表示):重新考虑基于视觉的语义占用预测
原文中文,约300字,阅读约需1分钟。发表于: 。提出了 SparseOcc,一种受稀疏点云处理启发的高效占据网络,利用了无损稀疏潜在表示的三个关键创新。通过空间分解的 3D 稀疏卷积核执行潜在补全的 3D 稀疏扩散器;通过特征金字塔和稀疏插值从其他尺度获取信息;将 Transformer 头改造为稀疏变种。SparseOcc 在 FLOP 上实现了惊人的 74.9% 减少,同时在精确度上有所提高。
该文章介绍了一种紧凑的占据转换器(COTR),用于感知自主驾驶中的三维环境。COTR具有几何意识的编码器和语义意识的解码器,可以重建紧凑的三维占据表示。实验结果表明,COTR在性能上有明显的提升。