基于 Transformer 和 Tensor Product 的学生情感识别的多模态融合网络
原文中文,约400字,阅读约需1分钟。发表于: 。利用 FasterNet 和注意机制改进了 YOLOv5 架构,提高了对火车道和机场跑道上外来物体的检测能力,通过新数据集 AARFOD(航空铁路外来物体检测)证明了该模型相对于基准 YOLOv5 模型在性能上的显著提升,并降低了计算需求。
本研究提出了一种先进的GD机制,通过卷积和自注意操作实现。新模型Gold-YOLO在多尺度特征融合和延迟准确性平衡方面表现出色。首次在YOLO系列中实现了MAE风格的预训练,使得模型能够从无监督预训练中受益。在COCO val2017数据集上取得了39.9% AP和1030 FPS。超过了以前的SOTA模型YOLOv6-3.0-N的相似FPS+2.4%。