本文介绍了一种名为SSAN的语义自对齐网络,用于解决文本到图像中的人物再识别问题。SSAN通过提取语义对齐的部分级特征,并设计了一个多视角非局部网络来捕捉身体部分之间的关系,建立身体部位和名词短语之间的对应关系。实验证明,该方法在性能上优于现有方法,并提供了新的数据集和代码。
完成下面两步后,将自动完成登录并继续当前操作。