一个简单的解释型 Transformer 用于细粒度图像分类与分析
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文研究了基于Transformer的目标检测器(DETR)在处理遮挡和对抗扰动等不同图像干扰方面存在的问题。通过多种实验和基准测试,发现DETR在处理遮挡图像的信息丢失干扰方面表现良好,但在涂有对抗标记的图像上表现较差。此外,DETR在进行预测时严重依赖于主要查询,导致查询之间的贡献不平衡。
🎯
关键要点
- 基于 Transformer 的目标检测器 (DETR) 在机器视觉任务中表现出显著性能。
- DETR 在处理遮挡图像的信息丢失干扰方面表现良好。
- DETR 在涂有对抗标记的图像上表现较差,网络需要产生不必要的键、查询和值。
- 与 YOLOv5 相比,DETR 在图像损坏基准测试中的性能较差。
- DETR 在进行预测时严重依赖于主要查询,导致查询之间的贡献不平衡。
🏷️
标签
➡️