BEVDiffuser: Plug-and-Play Diffusion Model for Denoising Bird's Eye View with Ground-Truth Guidance
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了BEVDiffuser,一种基于真实场景引导的扩散模型,旨在解决鸟瞩视图(BEV)中的噪声问题。该模型在nuScenes数据集上表现优异,3D目标检测mAP提高12.3%,NDS提高10.1%,有效增强了BEV表示的去噪能力。
🎯
关键要点
- BEVDiffuser是一种新型的扩散模型,旨在解决鸟瞩视图(BEV)中的噪声问题。
- 该模型通过真实物体布局引导去噪,能够以插件形式增强现有BEV模型。
- 在nuScenes数据集上,BEVDiffuser的3D目标检测mAP提高了12.3%,NDS提高了10.1%。
- BEVDiffuser在复杂条件下的长尾目标检测也有显著改善,验证了其去噪和增强BEV表示的有效性。
🏷️
标签
➡️