本文介绍了一种内存高效的方法SOccDPT,用于从单目图像中进行3D语义占用预测。通过无结构数据集训练,解决了现有方法在结构化交通数据集训练时的局限性。通过半监督训练流程,减少手动标注的要求,使用伪基准真实标签代替,产生了班加罗尔语义占用数据集。引入分块训练,减少了自动图构建过程中的内存使用。在无结构交通和内存受限的环境中,SOccDPT表现更好,RMSE分数为9.1473,语义分割IoU得分为46.02%,竞争频率为69.47 Hz。
BEVFormer是一种纯视觉的自动驾驶感知算法,通过融合环视相机图像的空间和时序特征显式的生成具有强表征能力的BEV特征,并应用于下游3D检测、分割等任务,取得了SOTA的结果。
完成下面两步后,将自动完成登录并继续当前操作。