本文提出了一种动态语义原型演化方法(DSP)和双重语义视觉变换器模块(DSVTM),旨在提升生成零样本学习(ZSL)的性能。DSVTM通过实例驱动的语义编码器和解码器,增强了语义与视觉特征的匹配,减轻了已知类偏见。此外,研究还提出了多模态循环一致性方法和新的分层语义视觉适应框架,均在多个数据集上展现了优越的性能。
本文介绍了双重语义视觉变换器模块(DSVTM),通过建立属性原型与视觉特征的对应关系,构建了逐步的语义-视觉相互适应网络(PSVMA),从而提高了语义消歧和知识可转移性,表现优于现有方法。此外,研究提出了多种零样本学习算法,利用生成对抗网络(GAN)和条件变分自编码器(VAE)等技术,显著提升了分类性能。
完成下面两步后,将自动完成登录并继续当前操作。