通过信息增强和自适应特征融合的方式,在 DETR 中进行小物体检测

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本论文介绍了一种改进的DETR检测器,使用简洁设计、单尺度特征图和全局交叉注意力计算,没有特定的局部约束。通过添加盒子到像素相对位置偏差项和基于遮蔽图像模型的骨干预训练,改进的DETR检测器在原始DETR检测器的基础上取得了显著的改进。

🎯

关键要点

  • 本论文介绍了一种改进的DETR检测器,采用简洁设计和单尺度特征图。
  • 改进的DETR没有特定的局部约束,未重新引入多尺度和局部性架构偏好。
  • 提出了两种技术来弥补多尺度特征图和局部性约束缺失的问题。
  • 第一种技术是将盒子到像素相对位置偏差项添加到交叉注意力公式中。
  • 第二种技术是基于遮蔽图像模型的骨干预训练,有助于学习细粒度定位能力的表示。
  • 结合这些技术和最新的训练方法,改进的DETR在原始DETR基础上取得显著改进。
  • 使用Object365数据集进行预训练,Swin-L骨干网络达到了63.9的平均精度(mAP)。
  • 改进的DETR性能与依赖多尺度特征图和基于区域的特征提取的最先进检测器相媲美。
➡️

继续阅读