关系 DETR: 探索目标检测中的显式位置关系先验

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

本文提出了一种通用的增强对象检测方案,通过引入编码器构建位置关系嵌入以改进注意力。实验证明该方法在多个数据集上有效,并且相较于现有的检测器有显著改进。同时,引入了一个新的检测数据集,结果表明显式位置关系的提出对通用目标检测有潜力。

🎯

关键要点

  • 本文提出了一种通用的增强对象检测方案,旨在改善 DET R 的收敛性和性能。
  • 该方案通过将位置关系先验作为注意力偏置来增强对象检测。
  • 引入编码器构建位置关系嵌入,以逐步改进注意力。
  • 扩展 DET R 的传统流水线为对比关系流水线,以解决非重复预测和正面监督之间的冲突。
  • 广泛实验验证了该方法在多个数据集上的有效性,尤其是在 COCO val2017 上获得了 +2.0%AP 的显著改进。
  • 最新性能为 1x: 51.7% AP,2x: 52.1% AP,且收敛速度更快,仅需 2 个训练周期时 AP 提高超过 40%。
  • 提出的关系编码器作为通用的即插即用组件,为任何 DET R 类方法带来明显改进。
  • 引入了类无关的检测数据集(SA-Det-100k),实验结果显示显式位置关系提高了 1.3%的 AP,凸显其对通用目标检测的潜力。
➡️

继续阅读