无人机热图中使用深度学习进行目标检测
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本研究提出了一种神经网络模型,能够在无人机收集的热像图中识别小型和超小型目标。模型结构包括骨干网络、中间层和预测头,使用了Transformer编码器。实验结果表明,该模型具有更高的准确度,并在嵌入式计算机上实现了实时计算。
🎯
关键要点
- 本研究提出了一种神经网络模型,能够在无人机收集的热像图中识别小型和超小型目标。
- 模型结构包括骨干网络、中间层和预测头,骨干网络基于 YOLOv5 结构,结尾使用了 Transformer 编码器。
- 中间层采用了 BI-FPN 块以及滑动窗口和 Transformer 增加预测头的信息输入。
- 预测头通过 Sigmoid 函数对特征图执行检测。
- Transformer 的注意力和滑动窗口的使用提高了识别准确性,同时保持了模型在嵌入式系统中的合理参数和计算需求。
- 实验在公共数据集 VEDAI 和自己收集的数据集上进行,结果表明本模型具有更高的准确度。
- 与 ResNet、Faster RCNN、ComNet、ViT、YOLOv5、SMPNet 和 DPNetV3 等最先进方法相比,本模型表现更优。
- 在嵌入式计算机 Jetson AGX 上的实验表明,本模型实现了实时计算,并具有超过 90% 的稳定性率。
➡️