BriefGPT - AI 论文速递 ·

MS-DETR: 使用混合监督实现高效的 DETR 训练

💡 原文中文，约500字，阅读约需2分钟。

📝

内容提要

本论文介绍了一种改进的DETR检测器，使用简洁设计和全局交叉注意力计算，通过添加盒子到像素相对位置偏差项和基于遮蔽图像模型的骨干预训练，取得了显著改进。预训练使用Object365数据集，达到63.9的平均精度(mAP)。

🎯

关键要点

本论文介绍了一种改进的DETR检测器，采用简洁设计和全局交叉注意力计算。
改进的DETR没有重新引入多尺度和局部性的架构偏好。
提出了两种技术来弥补多尺度特征图和局部性约束缺失的问题。
第一种技术是将盒子到像素相对位置偏差项添加到交叉注意力公式中。
第二种技术是基于遮蔽图像模型的骨干预训练，帮助学习细粒度定位能力的表示。
结合这些技术和最新的训练方法，改进的DETR检测器取得了显著的性能提升。
使用Object365数据集进行预训练，达到了63.9的平均精度（mAP）。
改进的DETR性能与依赖于多尺度特征图的最先进检测器相媲美。

🏷️

标签

DETR检测器像素相对位置偏差项全局交叉注意力计算简洁设计遮蔽图像模型

➡️

继续阅读

法院批准A社与作者和出版社的15亿美元和解协议初步解决A社使用盗版图书训练模型问题
#人工智能法院批准 A 社与作者和出版社的 15 亿美元和解协议，初步解决 A 社使用盗版书籍训练模型的集体诉讼案件。法庭文件显示，A 社建立拥有 70...
Q2 2026 earnings call: Remarks from our CEO
Read an edited transcript of Sundar Pichai’s remarks from the Q2 2026 Alphabe...
Django 6.1 release candidate 1 released
Django 6.1 release candidate 1 is now available. It represents the final oppo...
Price-hiked iPads are a little cheaper right now
A number of Apple products got more expensive last month, so we’re happy to f...
iOS code could reportedly let Apple cut off apps when users miss iPhone payments
Code found in an iOS 27 beta would allow Apple to put a financed iPhone in &#...
酷鸭数据美国CN2 云服务器测评，1核1G 5M 仅需14.85元/月
酷鸭数据美国洛杉矶VPS测评：2核4G 7M带宽，电信去回程走CN2，联通AS4837，移动CMIN2，三网直连延迟约173ms。性能中等，解锁Netfl...