本文介绍了一种新方法,通过多流递归神经网络模型预测自动驾驶车辆的位置和规模。研究表明,明确建模车辆未来运动可提高预测准确性。提出的BEVFormer框架在nuScenes测试集中达到56.9%的技术水平,显著提升了低能见度下的速度估计和对象召回准确性。此外,FipTR框架通过实例查询直接估计未来占用掩码,优化了预测过程。
本研究通过低秩适配(LoRA)技术改进鸟瞰图(BEV)表示,增强了其在环境变化和故障下的鲁棒性。实验结果表明,该方法在参数更少、训练更快的情况下,显著提升了BEV感知效果。
本文介绍了一种基于多视角LiDAR和摄像头图像的物体检测与轨迹预测方法,利用Bird's-Eye View (BEV)网络融合历史数据和高清地图,提升无人驾驶车辆的感知能力。研究提出了M-BEV和TempBEV框架,通过聚合多传感器信息,提高了鲁棒性和准确性,尤其在低能见度条件下表现优异。
本文介绍了多种基于鸟瞰视角(BEV)的3D物体检测算法,如BEVDet、M2BEV和PolarDETR。这些算法通过数据增强、极坐标表示和多视角输入等技术,提高了检测精度和效率。最新的RCBEVDet方法结合雷达与相机特征,展现了在自动驾驶中的应用潜力。
本文综述了鸟瞰图(BEV)感知的最新研究,重点讨论多传感器融合、物体检测与定位等关键问题。介绍了M-BEV框架、RoboBEV基准和FedBEVT方法,强调预训练和无深度变换的有效性。此外,提出了BEVerse框架和POWERBEV端到端框架,展示了在自动驾驶任务中的性能提升。最后,研究了无监督学习方法,利用少量标注数据生成语义鸟瞰地图,以增强遮挡推理能力。
本文提出了多种基于鸟瞰图(BEV)的方法,显著提升了图像匹配、建筑属性分割和车辆重定位的性能。通过引入新的损失函数和模型架构,这些方法在多个数据集上实现了准确率和召回率的显著提升,展示了在自动驾驶和地理定位任务中的应用潜力。
基于视觉的道路三维物体检测中,提出了一种新的体素池化策略 BEVSpread,通过自适应权重将图像特征传播到周围的 BEV 格点,使得现有基于截锥体和 BEV 的方法在车辆、行人和骑行者方面得到明显的性能提升。
本文提出了一种半监督框架,利用未标记的图像提高视觉鸟瞰语义分割的准确性。实验证明该框架有效提高预测准确性。
本文提出了一种利用多视角 LiDAR 返回和摄像头图像的终端到终端物体检测和轨迹预测方法,使用 Bird's-Eye View (BEV) 网络的状态-of-the-art 融合历史 LiDAR 数据和高清地图的体素化特征来执行检测和预测任务。在实际的无人驾驶车辆数据和公共 nuScenes 数据集上,所提出的多视角融合方法的表现都优于最先进的技术,并且增加了较少的计算成本。
本研究提出了VectorMapNet,一种端到端矢量化高清地图学习管道,可以预测鸟瞰图中的稀疏折线。实验结果显示,VectorMapNet在nuScenes和Argoverse2数据集上的地图学习性能优于以前的方法。
本研究提出了VectorMapNet,一种端到端矢量化高清地图学习管道,可预测鸟瞰图中的稀疏折线。实验结果显示,VectorMapNet在nuScenes和Argoverse2数据集上的地图学习性能优于以前的方法,MAP分别提高了14.2和14.6。
本研究提出了基于鸟瞰图的跨模态学习方法,用于三维语义分割的领域泛化。通过鸟瞰图下的交叉模态学习,优化了与领域无关的表示建模,同时提出了鸟瞰图驱动的领域对比学习方法来建模领域无关的表示。在三个三维数据集上,BEV-DG 在所有设置中明显优于现有方法,差距显著。
本研究提出了一种方法来训练适用于各种车辆类型的鸟瞰图分割模型,避免额外的数据收集和标注成本。该方法通过引入新颖的视图合成技术,解决了现有感知模型对于摄像机视角变化的敏感问题。
该研究提出了一种基于图像输入的自动停车位检测和占用分类算法。该算法通过在鸟瞰图上进行聚类来检测停车位,并使用特定训练的深度分类器对每个停车位进行占用或空置的分类。该方法在公开数据集上进行了评估,显示出较高的停车位检测效率和对非法停车或经过车辆的稳健性。训练的分类器在停车位占用分类方面准确性较高。
随着无人驾驶的兴起,激光雷达数据的目标检测成为了这几年的研究热点之一。常见的 3D 检测模型可以分成两类,一类是用 3D 小方格代表所有的激光点数据,每个小方格包含了这个方格内的特征,例如 VoxelNet 和 Vote3deep 。另一类则是先把三维信息投射到一个二维平面,通常是鸟瞰图 (BEV, Bird Eye View) 或是正视图 (Range...
完成下面两步后,将自动完成登录并继续当前操作。