使用内存高效稀疏卷积的自动驾驶实时三维语义占位预测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种自监督学习方法SelfOcc,通过视频序列学习3D占用情况,将图像转换为3D空间来得到3D场景表示,并利用自监督信号优化这些表示。SelfOcc在SemanticKITTI和Occ3D上相比之前最佳方法提高了58.7%,是首个在Occ3D上为周围摄像头产生合理的3D占用情况的自监督工作。SelfOcc在SemanticKITTI、KITTI-2015和nuScenes上达到了最先进的结果,实现了高质量的深度估计。
🎯
关键要点
- 提出了一种自监督学习方法SelfOcc,使用视频序列学习3D占用情况。
- 通过将图像转换为3D空间来得到3D场景表示,并利用自监督信号优化这些表示。
- SelfOcc在SemanticKITTI和Occ3D上相比之前最佳方法SceneRF提高了58.7%。
- SelfOcc是首个在Occ3D上为周围摄像头产生合理的3D占用情况的自监督工作。
- 在SemanticKITTI、KITTI-2015和nuScenes上,SelfOcc达到了最先进的结果。
- 实现了高质量的深度估计,包括新颖深度合成、单目深度估计和环视深度估计。
➡️