小红花·文摘

本研究比较了遮蔽图像模型（MIM）与监督式预训练模型的表现，发现MIM在细粒度分类任务中表现优异。提出的A^2MIM框架通过研究补丁间相互作用提升了模型处理能力。MIMIR方法增强了Vision Transformers的鲁棒性，而MimCo框架则结合了MIM与对比学习，提高了预训练效果。此外，研究探讨了MIM在医学图像分析中的应用，显示其在监督学习中更快且精度更高。

AEMIM：对抗样本与遮蔽图像建模相遇

BriefGPT - AI 论文速递 ·

本论文介绍了一种改进的DETR检测器，使用简洁设计和全局交叉注意力计算，通过添加盒子到像素相对位置偏差项和基于遮蔽图像模型的骨干预训练，取得了显著改进。预训练使用Object365数据集，达到63.9的平均精度(mAP)。

MS-DETR: 使用混合监督实现高效的 DETR 训练

BriefGPT - AI 论文速递 ·

本文介绍了一种改进的DETR检测器，使用单尺度特征图和全局交叉注意力计算，通过添加盒子到像素相对位置偏差和基于遮蔽图像模型的骨干预训练来弥补多尺度特征图和局部性约束缺失的问题。改进的DETR检测器在Object365数据集上达到了63.9的平均精度(mAP)，与依赖于多尺度特征图和基于区域的特征提取的最先进的检测器性能相媲美。

解耦的 DETR：空间分离定位和分类以改善端到端对象检测

BriefGPT - AI 论文速递 ·

本文介绍了一种改进的DETR检测器，采用了简洁的设计，使用单尺度特征图和全局交叉注意力计算，通过添加盒子到像素相对位置偏差和基于遮蔽图像模型的骨干预训练来弥补多尺度特征图和局部性约束缺失的问题。该检测器在Object365数据集上预训练，使用Swin-L骨干网络达到了63.9的平均精度（mAP），与最先进的检测器性能相媲美。

高质量物体检测的 Rank-DETR

BriefGPT - AI 论文速递 ·

本论文介绍了一种改进的DETR检测器，采用简洁设计，使用单尺度特征图和全局交叉注意力计算，没有特定的局部约束。通过添加盒子到像素相对位置偏差项和基于遮蔽图像模型的骨干预训练，改进的DETR检测器在原始DETR检测器的基础上取得了显著的改进。使用Object365数据集进行预训练，达到了63.9的平均精度（mAP），与最先进的检测器性能相媲美。

自反馈 DETR 用于时态行为检测

BriefGPT - AI 论文速递 ·