LRR: 基于语言驱动的可重采样连续表示抵抗对抗追踪攻击
💡
原文中文,约1400字,阅读约需4分钟。
📝
内容提要
本文探讨了在线视频目标跟踪中的对抗攻击,提出了一种名为SPARK的增量攻击方法,能够有效误导多种基准跟踪器。研究还介绍了基于卷积神经网络的跟踪方法和新型空间监督递归卷积神经网络,提升了跟踪的准确性和鲁棒性。此外,提出了无监督对象跟踪架构和基于实例到轨迹匹配的学习方法,展示了在复杂场景中的优越性能。
🎯
关键要点
- 本文提出了一种新的对抗攻击任务,通过在线生成微小扰动来误导跟踪器。
- 提出的增量攻击方法SPARK在多个基准跟踪器上有效且具有较强的可迁移性。
- 介绍了一种基于卷积神经网络的追踪方法,能够在SOTA追踪中表现出色,甚至超过基于Transformer的追踪器。
- 提出了一种新的空间监督递归卷积神经网络,结合卷积网络的高层视觉特征,提升了跟踪的准确性和鲁棒性。
- 设计了一种无监督对象跟踪体系结构,能够在复杂场景中更好地跟踪多个物体。
- 提出了一种基于实例到轨迹匹配的外观嵌入学习方法,能够进行半监督学习并在多个数据集上表现优异。
- 提出了一种端到端视频视觉跟踪方法,结合循环卷积神经网络和强化学习算法,提升了跟踪性能。
❓
延伸问答
SPARK攻击方法的主要特点是什么?
SPARK是一种基于稀疏性的增量攻击方法,能够有效误导多个基准跟踪器,并具有较强的可迁移性。
本文提出的无监督对象跟踪体系结构有什么优势?
无监督对象跟踪体系结构在复杂场景中能够更好地跟踪多个物体,表现优于其他方法。
如何提高视频目标跟踪的准确性和鲁棒性?
通过结合卷积网络的高层视觉特征和空间监督递归卷积神经网络,可以提升跟踪的准确性和鲁棒性。
基于卷积神经网络的追踪方法与基于Transformer的追踪器相比如何?
基于卷积神经网络的追踪方法在SOTA追踪中表现出色,甚至超过了基于Transformer的追踪器。
本文中提到的实例到轨迹匹配的外观嵌入学习方法有什么特点?
该方法能够进行半监督学习,并在多个数据集上表现优异,适用于在线多目标跟踪问题。
如何实现端到端的视频视觉跟踪?
通过结合循环卷积神经网络和强化学习算法,可以实现端到端的视频视觉跟踪,提升跟踪性能。
➡️