UniDrive：面向多种摄像头配置的通用驾驶感知

本研究解决了自动驾驶感知模型在不同摄像头配置下表现不一致的问题。我们提出了UniDrive框架，通过引入统一的虚拟摄像头和基于地面的投影方法，优化摄像头配置，增强了驾驶感知模型的适应性和可靠性。研究结果表明，该方法在一个特定摄像头配置上训练后，可以有效应用于多种配置，性能下降非常有限。

本文介绍了UniPAD，这是一种利用3D体积可微分渲染的自监督学习方法。通过隐含编码3D空间，UniPAD增强了3D形状重建和2D投影特征的能力。实验显示，该方法在激光雷达和摄像头基线上显著提升性能，尤其在nuScenes验证集上实现了领先的3D物体检测和语义分割结果。

3D检测 3D渲染 UniPAD 自监督学习语义分割