小红花·文摘

本文介绍了一种新方法，通过多流递归神经网络模型预测自动驾驶车辆的位置和规模。研究表明，明确建模车辆未来运动可提高预测准确性。提出的BEVFormer框架在nuScenes测试集中达到56.9%的技术水平，显著提升了低能见度下的速度估计和对象召回准确性。此外，FipTR框架通过实例查询直接估计未来占用掩码，优化了预测过程。

CASPFormer：基于变形注意力的鸟瞰图图像轨迹预测

BriefGPT - AI 论文速递 ·

本研究通过低秩适配（LoRA）技术改进鸟瞰图（BEV）表示，增强了其在环境变化和故障下的鲁棒性。实验结果表明，该方法在参数更少、训练更快的情况下，显著提升了BEV感知效果。

Robust Bird's Eye View Segmentation by Adapting DINOv2

BriefGPT - AI 论文速递 ·

本文介绍了一种基于多视角LiDAR和摄像头图像的物体检测与轨迹预测方法，利用Bird's-Eye View (BEV)网络融合历史数据和高清地图，提升无人驾驶车辆的感知能力。研究提出了M-BEV和TempBEV框架，通过聚合多传感器信息，提高了鲁棒性和准确性，尤其在低能见度条件下表现优异。

通过多摄像头训练改善单摄像头的鸟瞰图感知

BriefGPT - AI 论文速递 ·

本文介绍了多种基于鸟瞰视角（BEV）的3D物体检测算法，如BEVDet、M2BEV和PolarDETR。这些算法通过数据增强、极坐标表示和多视角输入等技术，提高了检测精度和效率。最新的RCBEVDet方法结合雷达与相机特征，展现了在自动驾驶中的应用潜力。

PolarBEVDet：探索极坐标表示以实现鸟瞰图中的多视角 3D 物体检测

BriefGPT - AI 论文速递 ·

本文综述了鸟瞰图（BEV）感知的最新研究，重点讨论多传感器融合、物体检测与定位等关键问题。介绍了M-BEV框架、RoboBEV基准和FedBEVT方法，强调预训练和无深度变换的有效性。此外，提出了BEVerse框架和POWERBEV端到端框架，展示了在自动驾驶任务中的性能提升。最后，研究了无监督学习方法，利用少量标注数据生成语义鸟瞰地图，以增强遮挡推理能力。

自动驾驶的分层和解耦的 BEV 感知学习框架

BriefGPT - AI 论文速递 ·

本文提出了多种基于鸟瞰图（BEV）的方法，显著提升了图像匹配、建筑属性分割和车辆重定位的性能。通过引入新的损失函数和模型架构，这些方法在多个数据集上实现了准确率和召回率的显著提升，展示了在自动驾驶和地理定位任务中的应用潜力。

有限视野跨视角地理定位的窗口到窗口 BEV 表示学习

BriefGPT - AI 论文速递 ·

基于视觉的道路三维物体检测中，提出了一种新的体素池化策略 BEVSpread，通过自适应权重将图像特征传播到周围的 BEV 格点，使得现有基于截锥体和 BEV 的方法在车辆、行人和骑行者方面得到明显的性能提升。

BEVSpread：基于扩散体素池化的鸟瞰图表示在基于视觉的路边三维物体检测中应用

BriefGPT - AI 论文速递 ·

本文介绍了多种基于车载摄像头的鸟瞰视角（BEV）语义分割方法，包括新型半监督框架和自我监督技术，显著提高了预测准确性。研究展示了通过多摄像头和神经网络实现的高效分割与检测，提出的模型在多个数据集上表现优越，推动了自动驾驶技术的发展。

通过任务分解提高鸟瞰图语义分割

BriefGPT - AI 论文速递 ·

本文介绍了一种新的多视角检测系统MVDet，采用鸟瞰图方法提升多目标检测和跟踪的准确性。在新数据集MultiviewX上，该方法性能提升14.1%。该框架结合多传感器数据，优化了3D物体检测和轨迹预测，优于现有技术。

将多视角检测和跟踪提升至鸟瞰视角

BriefGPT - AI 论文速递 ·

本文提出了一种利用多视角 LiDAR 返回和摄像头图像的终端到终端物体检测和轨迹预测方法，使用 Bird's-Eye View (BEV) 网络的状态-of-the-art 融合历史 LiDAR 数据和高清地图的体素化特征来执行检测和预测任务。在实际的无人驾驶车辆数据和公共 nuScenes 数据集上，所提出的多视角融合方法的表现都优于最先进的技术，并且增加了较少的计算成本。

鱼眼相机与超声波传感器在鸟瞰图中近场障碍物感知的融合

BriefGPT - AI 论文速递 ·

本研究提出了VectorMapNet，一种端到端矢量化高清地图学习管道，可以预测鸟瞰图中的稀疏折线。实验结果显示，VectorMapNet在nuScenes和Argoverse2数据集上的地图学习性能优于以前的方法。

ADMap: 在线重建矢量化高清地图的抗干扰框架

BriefGPT - AI 论文速递 ·

本研究提出了VectorMapNet，一种端到端矢量化高清地图学习管道，可预测鸟瞰图中的稀疏折线。实验结果显示，VectorMapNet在nuScenes和Argoverse2数据集上的地图学习性能优于以前的方法，MAP分别提高了14.2和14.6。

LaneSegNet: 自动驾驶车辆的车道段感知地图学习

BriefGPT - AI 论文速递 ·

本研究提出了基于鸟瞰图的跨模态学习方法，用于三维语义分割的领域泛化。通过鸟瞰图下的交叉模态学习，优化了与领域无关的表示建模，同时提出了鸟瞰图驱动的领域对比学习方法来建模领域无关的表示。在三个三维数据集上，BEV-DG 在所有设置中明显优于现有方法，差距显著。

朝着联网与自动驾驶的多智能体协作鸟瞰图分割的全场景域泛化

BriefGPT - AI 论文速递 ·

本研究提出了一种方法来训练适用于各种车辆类型的鸟瞰图分割模型，避免额外的数据收集和标注成本。该方法通过引入新颖的视图合成技术，解决了现有感知模型对于摄像机视角变化的敏感问题。

鸟瞰图分割中的视角鲁棒性

BriefGPT - AI 论文速递 ·

该研究提出了一种基于图像输入的自动停车位检测和占用分类算法。该算法通过在鸟瞰图上进行聚类来检测停车位，并使用特定训练的深度分类器对每个停车位进行占用或空置的分类。该方法在公开数据集上进行了评估，显示出较高的停车位检测效率和对非法停车或经过车辆的稳健性。训练的分类器在停车位占用分类方面准确性较高。

基于视觉的自动停车位检测和占用分类

BriefGPT - AI 论文速递 ·

随着无人驾驶的兴起，激光雷达数据的目标检测成为了这几年的研究热点之一。常见的 3D 检测模型可以分成两类，一类是用 3D 小方格代表所有的激光点数据，每个小方格包含了这个方格内的特征，例如 VoxelNet 和 Vote3deep 。另一类则是先把三维信息投射到一个二维平面，通常是鸟瞰图 (BEV, Bird Eye View) 或是正视图 (Range...

3D 目标检测之鸟瞰图检测 (Pixor / HDNet)

Aiur · Zellux 的博客 ·