使用内存高效稀疏卷积的自动驾驶实时三维语义占位预测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种自监督学习方法SelfOcc,通过视频序列学习3D占用情况,将图像转换为3D空间来得到3D场景表示,并利用自监督信号优化这些表示。SelfOcc在SemanticKITTI和Occ3D上相比之前最佳方法提高了58.7%,是首个在Occ3D上为周围摄像头产生合理的3D占用情况的自监督工作。SelfOcc在SemanticKITTI、KITTI-2015和nuScenes上达到了最先进的结果,实现了高质量的深度估计。

🎯

关键要点

  • 提出了一种自监督学习方法SelfOcc,使用视频序列学习3D占用情况。
  • 通过将图像转换为3D空间来得到3D场景表示,并利用自监督信号优化这些表示。
  • SelfOcc在SemanticKITTI和Occ3D上相比之前最佳方法SceneRF提高了58.7%。
  • SelfOcc是首个在Occ3D上为周围摄像头产生合理的3D占用情况的自监督工作。
  • 在SemanticKITTI、KITTI-2015和nuScenes上,SelfOcc达到了最先进的结果。
  • 实现了高质量的深度估计,包括新颖深度合成、单目深度估计和环视深度估计。
➡️

继续阅读