DiffYOLO:基于 YOLO 和扩散模型的抗噪声目标检测
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究提出了GD机制,利用卷积和自注意操作实现Gold-YOLO模型。该模型在多尺度特征融合和延迟准确性平衡方面有所提升。首次在YOLO系列中实现了MAE风格的预训练,使得模型能够从无监督预训练中受益。在COCO val2017数据集上,Gold-YOLO-N取得了39.9% AP和1030 FPS,超过了YOLOv6-3.0-N的相似FPS+2.4%。
🎯
关键要点
- 提出了一种先进的 Gatherand-Distribute 机制(GD 机制)。
- Gold-YOLO模型在多尺度特征融合能力上有所提升。
- 实现了延迟和准确性之间的理想平衡。
- 首次在YOLO系列中实现了MAE风格的预训练。
- Gold-YOLO-N在COCO val2017数据集上取得了39.9% AP和1030 FPS。
- Gold-YOLO-N超过了YOLOv6-3.0-N的相似FPS+2.4%。
➡️