DPDETR:解耦位置检测变换器用于红外-可见物体检测
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本文提出了一种用于增强DET R的通用方案,通过引入编码器构建位置关系嵌入,将DET R扩展为对比关系流水线,解决了非重复预测和正面监督之间的冲突。实验证明该方法在COCO val2017上获得了显著的改进,并具有更快的收敛速度。同时,该方法还提出了一个类无关的检测数据集,提高了通用目标检测的潜力。
🎯
关键要点
- 提出了一种增强DET R(Detection Transformer)收敛性和性能的通用方案。
- 通过将位置关系先验作为注意力偏置来增强对象检测。
- 引入编码器构建位置关系嵌入,逐步改进注意力。
- 将DET R传统流水线扩展为对比关系流水线,解决非重复预测和正面监督之间的冲突。
- 在COCO val2017上获得显著改进(+2.0%AP),最新性能为1x: 51.7% AP,2x: 52.1% AP。
- 收敛速度更快,仅需2个训练周期时AP提高超过40%。
- 提出的关系编码器作为通用即插即用组件,为任何DET R类方法带来明显改进。
- 引入类无关的检测数据集(SA-Det-100k),显式位置关系提高了1.3%的AP,增强了通用目标检测的潜力。
🏷️
标签
➡️