DiffYOLO:基于 YOLO 和扩散模型的抗噪声目标检测
原文中文,约400字,阅读约需1分钟。发表于: 。利用 DiffYOLO 框架提取特征图以增强已训练模型,从而使在高质量数据集上微调 YOLO 模型并在低质量数据集上进行测试成为可能。该框架不仅能在嘈杂的数据集上提升性能,还能在高质量测试数据集上证明检测结果。
本研究提出了GD机制,利用卷积和自注意操作实现Gold-YOLO模型。该模型在多尺度特征融合和延迟准确性平衡方面有所提升。首次在YOLO系列中实现了MAE风格的预训练,使得模型能够从无监督预训练中受益。在COCO val2017数据集上,Gold-YOLO-N取得了39.9% AP和1030 FPS,超过了YOLOv6-3.0-N的相似FPS+2.4%。