跨平台视频行人重识别:新的基准数据集与适应方法
原文中文,约500字,阅读约需2分钟。发表于: 。本研究构建了一个大型的基准数据集G2A-VReID,针对地面至空中场景的视频行人重识别任务,填补了该领域的空白。论文提出了一种新的基准方法VSLA-CLIP,通过视觉-语义对齐和高效的视频集级适配模块显著提升了跨平台重识别的效果。实验结果表明,该方法在现有视频ReID数据集和G2A-VReID数据集上均表现优越。
本文介绍了一种解决空中-地面人物再识别(AGPReID)问题的方法,名为视角解耦转换器(VDT)。VDT通过层次减法分离和正交损失来解耦与视角相关和视角无关的特征,减少视角差异对身份表征的干扰。实验证明,VDT在AGPReID上的性能超过了先前的方法。