从全局表示内存中读取相关特征进行视觉目标跟踪
原文中文,约300字,阅读约需1分钟。发表于: 。通过引入关联性注意机制和全局表示记忆,我们提出了一种新的跟踪范式,该范式可以自适应地帮助搜索区域选择最相关的参考特征的历史信息,以减少冗余,提升跟踪性能。
本文研究了通过在计算机视觉系统中使用记忆来改进视频流中的物体检测的精度和减少计算时间的问题。通过交替使用传统的特征提取器和轻量级的提取器,展示了在存在时间记忆的情况下,进行准确检测所需的计算量很小。同时,展示了记忆可以应用于强化学习算法来学习自适应推断策略。该模型在 Imaget VID 2015 数据集上实现了最先进的性能,并在 Pixel 3 手机上以 70+ FPS 的速度运行。