OE-BevSeg: 面向对象和环境感知的多模态框架,用于鸟瞰视角车辆语义分割
原文中文,约200字,阅读约需1分钟。发表于: 。OE-BevSeg 是一种全局环境感知和局部目标物体增强的多模态框架,通过环境感知的 Bird's-eye-view 语义分割压缩器和中心信息引导的目标物体增强模块,以及多视角 RGB 图像特征与雷达 / LiDAR 特征的多模态融合分支,极大地提高了自主驾驶领域中 Bird's-eye-view 语义分割任务的性能。
该论文介绍了一种新方法,用于卫星和街景图像对的建筑属性分割。通过引入鸟瞰图方法和卫星引导的投影模块,解决了传统方法中的局限性和特征分布不均匀的问题。在多个城市的数据集上,该方法相比最先进的方法,平均 mIOU 提高了10.13%和5.21%。