Transformer 从语言到视觉到 MOT 的发展:对基于 Transformer 的多目标跟踪的文献综述
原文中文,约200字,阅读约需1分钟。发表于: 。transformer 神经网络结构通过注意力机制实现自回归的序列到序列建模,在自然语言处理和计算机视觉等领域取得了重大突破。本文综述了在计算机视觉领域中应用 transformer 的主要进展,并针对多目标跟踪 (MOT) 进行讨论,指出 transformer 在最新的 MOT 研究中逐渐具备竞争力,但仍然落后于传统深度学习方法。
本文总结了计算机视觉领域中应用transformer的进展,指出其在多目标跟踪研究中逐渐具备竞争力,但仍落后于传统深度学习方法。