BriefGPT - AI 论文速递 ·

TENet：融合多尺度池化和相互引导融合的 RGB-E 目标追踪

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了基于RGB-Event数据的模式识别研究，提出了轻量级CNN-Transformer模型TSCFormer，并验证了其在特征提取上的有效性。此外，研究还涉及多模态跟踪、对象检测框架EOLO及新数据集FELT，展示了在高帧率追踪和特征融合方面的创新成果。

🎯

❓

TSCFormer模型是一种轻量级的CNN-Transformer模型，在全局和本地特征提取上取得了平衡。

CEUTrack网络通过Transformer实现特征提取、融合、匹配和互动学习，用于跟踪基于颜色和事件的物体。

EOLO框架通过融合RGB和事件信息，实现了全天候稳健高效的检测，优于现有检测器。

FELT数据集包含742个视频和1,594,474个RGB帧和事件流对，是最大的帧事件跟踪数据集。

通过结合RGB-based trackers和event-based cameras的方法，应用多模态对齐和融合模块，实现高达240Hz的追踪频率。

该算法基于深度融合和递归策略，利用卷积神经网络的特征表示强化物体表示，并通过剪枝去除冗余特征。

🏷️