本文介绍了双重语义视觉变换器模块(DSVTM),通过建立属性原型与视觉特征的对应关系,构建了逐步的语义-视觉相互适应网络(PSVMA),从而提高了语义消歧和知识可转移性,表现优于现有方法。此外,研究提出了多种零样本学习算法,利用生成对抗网络(GAN)和条件变分自编码器(VAE)等技术,显著提升了分类性能。
完成下面两步后,将自动完成登录并继续当前操作。