本文通过引入自然语言表示提升多目标跟踪模型的泛化能力,提出视觉上下文提示和视觉-语言混合模块,生成实例级伪文字描述。在MOT17上训练并在MOT20上验证,显著提升了跟踪器的性能。
完成下面两步后,将自动完成登录并继续当前操作。