OccTransformer：改进 BEVFormer 以用于 3D 仅相机空间占用预测

我们的研究论文提出了一种名为 “occTransformer” 的解决方案，用于 CVPR 2023 的自动驾驶挑战中的 3D 占据预测。该方法基于强大的基准模型 BEVFormer，并通过几种简单但有效的技术来提高其性能。

本文介绍了一种内存高效的方法SOccDPT，用于从单目图像中进行3D语义占用预测。通过无结构数据集训练，解决了现有方法在结构化交通数据集训练时的局限性。通过半监督训练流程，减少手动标注的要求，使用伪基准真实标签代替，产生了班加罗尔语义占用数据集。引入分块训练，减少了自动图构建过程中的内存使用。在无结构交通和内存受限的环境中，SOccDPT表现更好，RMSE分数为9.1473，语义分割IoU得分为46.02%，竞争频率为69.47 Hz。

3D语义占用预测 SOccDPT 分块训练半监督训练无结构数据集