YOLOv5 目标检测笔记

YOLOv5 目标检测笔记

💡 原文中文,约6300字,阅读约需15分钟。
📝

内容提要

YOLOv5 的主干网络采用改进版 CSPDarknet,通过下采样提取特征,包含 Focus、CBS 和核心组件 C3 模块,优化了梯度传导。Neck 部分融合特征,使用 FPN 和 PAN 结构,最后 Head 模块根据不同特征图输出检测结果。

🎯

关键要点

  • YOLOv5 的主干网络采用改进版 CSPDarknet,通过下采样提取特征。
  • Backbone 的任务是将图片下采样,提取丰富的语义信息。
  • Focus 层在 v6.0 版本已被简单的卷积替代,进行高效下采样。
  • CBS 模块是网络的基本单元,包含卷积、批归一化和 SiLU 激活函数。
  • C3 模块是 YOLOv5 的核心组件,采用 CSPNet 结构,增强特征提取。
  • SPPF 模块在 Backbone 最末端,通过多次池化实现多尺度特征融合。
  • Neck 部分负责特征融合,使用 FPN 和 PAN 结构。
  • FPN 路径自顶向下传达语义,PAN 路径自底向上传达定位信息。
  • Head 模块根据 Neck 提供的特征图输出检测结果,负责小、中、大物体的检测。
  • 后处理阶段将三个头的输出拼接,并运行 NMS 进行非极大值抑制。
➡️

继续阅读