本研究提出了一种提示引导特征解耦方法(ProFD),用于解决遮挡人物再识别中的特征提取问题。通过特定提示和混合注意力解码器,ProFD有效对齐视觉与文本嵌入,提升了模型在有限数据下的学习能力,并在多个数据集上取得了优异成果。
该研究提出了一种新的统一视频分割架构(UniVS),通过使用提示作为查询来明确解码掩码,并引入目标导向的提示交叉注意力层。UniVS将不同的视频分割任务转化为提示引导的目标分割,消除了启发式的帧间匹配过程。该框架在不同的场景中实现了通用的训练和测试,并在10个具有挑战性的视频分割基准上展现了出色的性能和通用性。
完成下面两步后,将自动完成登录并继续当前操作。