OccTransformer:改进 BEVFormer 以用于 3D 仅相机空间占用预测
原文中文,约400字,阅读约需1分钟。发表于: 。我们的研究论文提出了一种名为 “occTransformer” 的解决方案,用于 CVPR 2023 的自动驾驶挑战中的 3D 占据预测。该方法基于强大的基准模型 BEVFormer,并通过几种简单但有效的技术来提高其性能。
本文介绍了一种内存高效的方法SOccDPT,用于从单目图像中进行3D语义占用预测。通过无结构数据集训练,解决了现有方法在结构化交通数据集训练时的局限性。通过半监督训练流程,减少手动标注的要求,使用伪基准真实标签代替,产生了班加罗尔语义占用数据集。引入分块训练,减少了自动图构建过程中的内存使用。在无结构交通和内存受限的环境中,SOccDPT表现更好,RMSE分数为9.1473,语义分割IoU得分为46.02%,竞争频率为69.47 Hz。