从全局表示内存中读取相关特征进行视觉目标跟踪
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究了通过在计算机视觉系统中使用记忆来改进视频流中的物体检测的精度和减少计算时间的问题。通过交替使用传统的特征提取器和轻量级的提取器,展示了在存在时间记忆的情况下,进行准确检测所需的计算量很小。同时,展示了记忆可以应用于强化学习算法来学习自适应推断策略。该模型在 Imaget VID 2015 数据集上实现了最先进的性能,并在 Pixel 3 手机上以 70+ FPS 的速度运行。
🎯
关键要点
-
研究通过使用记忆改进视频流中的物体检测精度和减少计算时间。
-
交替使用传统特征提取器和轻量级提取器,计算量小。
-
记忆可以应用于强化学习算法,学习自适应推断策略。
-
模型在 Imaget VID 2015 数据集上实现最先进性能。
-
模型在 Pixel 3 手机上以 70+ FPS 的速度运行。
➡️