UMMAFormer:一种用于时间伪造定位的通用多模式自适应 Transformer 框架

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于transformers的追踪框架MixFormer,通过Mixed Attention Module实现特征提取和目标信息集成的同步建模。设计了两种类型的MixFormer追踪器,使用不同的预训练方法,提出了减少计算成本的不对称注意机制和有效的得分预测模块。在七个追踪基准中创造了最新的性能标准。

🎯

关键要点

  • 提出了一种基于transformers的追踪框架MixFormer。
  • 通过Mixed Attention Module实现特征提取和目标信息集成的同步建模。
  • 设计了两种类型的MixFormer追踪器,使用不同的预训练方法。
  • 提出了减少计算成本的不对称注意机制。
  • 提出了有效的得分预测模块。
  • 在七个追踪基准中创造了最新的性能标准,包括LaSOT、TrackingNet、VOT2020、GOT-10k、OTB100和UAV123。
➡️

继续阅读