本研究提出了ChatBEV-QA基准,包含超过137,000个问题,旨在提升交通场景理解。通过改进ChatBEV模型,从BEV地图中提取上下文信息,提高交通场景生成的真实感和一致性。
本文介绍了在3D占用预测挑战中获胜的解决方案,基于FB-BEV进行优化,取得了nuScenes数据集的最佳mIoU得分。提出了FlashOCC和SparseOcc等新方法,提升了占用预测的精度和效率。同时,综述了基于视觉的3D占用状态预测的背景与挑战,并展示了新模型OccMamba在多个基准测试中的优越表现。
PersFormer是一种新型的单目3D车道检测器,利用相机参数生成鸟瞰图特征,支持2D/3D车道线检测。研究发布了OpenLane数据集,包含200,000帧和880,000个车道实例,证明了该模型在3D车道检测中的优越性,推动了3D车道检测技术的发展。
本文综述了鸟瞰图(BEV)感知的最新研究,重点讨论多传感器融合、物体检测与定位等关键问题。介绍了M-BEV框架、RoboBEV基准和FedBEVT方法,强调预训练和无深度变换的有效性。此外,提出了BEVerse框架和POWERBEV端到端框架,展示了在自动驾驶任务中的性能提升。最后,研究了无监督学习方法,利用少量标注数据生成语义鸟瞰地图,以增强遮挡推理能力。
本文介绍了一种名为 U-BEV 的神经网络架构,通过多层次场景推理和可微模板匹配,显著提升车辆重定位性能。在 nuScenes 数据集上,该方法的 mIoU 提高了 1.7-2.8,重现率提升超过 26%。新方法结合像素深度和语义,提升了 24% 的 mIoU,展示了在自动驾驶和视觉导航中的应用潜力。
本文提出了多种基于鸟瞰图(BEV)的方法,显著提升了图像匹配、建筑属性分割和车辆重定位的性能。通过引入新的损失函数和模型架构,这些方法在多个数据集上实现了准确率和召回率的显著提升,展示了在自动驾驶和地理定位任务中的应用潜力。
本文介绍了多种自动驾驶技术的进展,包括双映射框架Bi-Mapper、视觉语言模型Talk2BEV、语义分割模型LaRa和多任务融合框架BEVFusion。这些技术通过结合多模态信息和先进算法,提升了自动驾驶系统在场景理解、路径规划和安全性方面的性能。
本文提出了一种新颖的半监督框架,通过利用未标记的图像提高视觉鸟瞰(BEV)语义分割的性能。实验证明该框架可以有效提高预测准确性。代码将公开提供。
本文提出了一种基于图神经网络的方法,通过对场景中物体的空间关系,从单目图像中预测出鸟瞰地图中的物体,解决了纹理模型在远距离定位错误率增加的问题,并在三个大规模数据集上取得了最佳结果,包括相对于nuScenes数据集的50%提升。
本文介绍了一种利用多传感器数据的三维物体检测器,通过消除冲突融合方法(ECFusion)生成改进的多模态鸟瞰图特征。该方法在nuScenes三维物体检测数据集中取得了最先进的性能。
本文提出了一种利用几何信息进行图像特征转换的方法,解决自动驾驶中的瓶颈问题,并验证了方法的优越性。
本研究提出了一种高效的基于BEV的3D检测框架BEVENet,通过仅采用卷积架构设计,克服了ViT模型的局限性,同时保持了BEV方法的有效性。实验证明,BEVENet在NuScenes挑战赛中比当代最先进方法快3倍,同时在NuScenes验证数据集上获得0.456的平均精确度(mAP)和0.555的nuScenes检测分数(NDS),推断速度为47.6帧每秒。突显了BEV方法在实际自动驾驶应用中的可行性提升。
我们提出了一种多模式Bird's-Eye View(BEV)检索方法BEV-CLIP。它利用描述性文本作为输入来检索相应的场景,并结合语言模型和知识图的信息来提高语义丰富性和嵌入的多样性。在实验中,我们的方法在NuScenes数据集上达到了87.66%的准确率。
该研究提出了一种实用且高效的3D表示方法,将等变辐射场与鸟瞰图结合,通过操纵鸟瞰图操作合成的3D场景中的对象。通过融合位置编码和低通滤波器到生成器中,该表示对给定的鸟瞰图是等变的,能够生成大规模甚至无限规模的3D场景。实验证明了该方法的有效性。
本研究提出了一种高效的基于BEV的3D检测框架BEVENet,通过卷积架构设计,克服了ViT模型的局限性,保持了BEV方法的有效性。实验证明,BEVENet在NuScenes挑战赛中比当代方法快3倍,获得0.456的平均精确度和0.555的nuScenes检测分数,推断速度为47.6帧每秒。这是首次实现如此显著的BEV方法效率改进的研究,突显了它们在实际自动驾驶应用中的可行性提升。
提出了 PointBeV 方法,在稀疏的 Bird's-eye View 表示中进行分割模型操作,以有效控制内存使用,并在静态和时间设置中展示卓越性能。
本文介绍了一种新的OCBEV方法,用于动态场景中移动目标的检测。该方法在nuScenes数据集上取得了最先进的结果,比传统的BEVFormer提高了1.5个NDS点,并具有更快的收敛速度和更少的训练迭代次数。
完成下面两步后,将自动完成登录并继续当前操作。