关系 DETR: 探索目标检测中的显式位置关系先验
原文中文,约600字,阅读约需2分钟。发表于: 。本文提出了一种用于增强 DET R(Detection Transformer)的收敛性和性能的通用方案,通过探索将位置关系先验作为注意力偏置来增强对象检测。该方法引入编码器来构建位置关系嵌入,以逐步改进注意力,进一步将 DET R 传统的流水线扩展为对比关系流水线,以解决非重复预测和正面监督之间的冲突。对通用和特定任务的数据集进行的广泛实验验证了该方法的有效性,并且相较于...
本文提出了一种通用的增强对象检测方案,通过引入编码器构建位置关系嵌入以改进注意力。实验证明该方法在多个数据集上有效,并且相较于现有的检测器有显著改进。同时,引入了一个新的检测数据集,结果表明显式位置关系的提出对通用目标检测有潜力。