BriefGPT - AI 论文速递 ·

基于分组洗牌的多尺度多通道注意力和多模态监督的 RGB-T 目标检测

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文介绍了一种基于混合注意机制的RGB-T追踪器（MACFT），通过特征提取和融合提高了追踪的鲁棒性。提出了多模态混合损失方法（MMHL）和轻量级即时学习器，优化了RGB和热感特征的融合，实验结果表明该方法在多个数据集上表现优越。

🎯

❓

RGB-T追踪器（MACFT）通过特征提取和融合阶段利用不同的转换器骨干支路和混合注意操作，实现多模式适应性融合，从而提高了追踪的鲁棒性。

多模态混合损失方法（MMHL）在RGB和热感特征融合时考虑了空间和通道信息，优化了特征融合过程。

顺序训练策略通过先对RGB图像进行训练，再学习跨模态特征，从而提高了显著性检测性能，且无需额外计算开销。

研究中提出了局部关注和全局关注的视觉关注机制，用于RGB和热感数据的处理。

轻量级即时学习器旨在以低计算成本实现模态间信息转移，同时保持高运行速度和最先进的性能。

实验结果表明，该方法在多个数据集上表现优越，取得了卓越的性能。

🏷️