BigVSAN:利用切片对抗网络增强基于 GAN 的神经声码器 研究一种修改最小二乘 GAN 的方案以满足切片对抗网络(SAN)要求,通过实验验证切片对抗网络对基于 GAN 的合成器,包括 BigVGAN 的性能改进。 本文介绍了TGAN,一种生成式模型,用于学习未标记视频的语义表示并生成视频。该模型通过时间生成器和图像生成器解决了现有GAN方法生成视频时的问题。采用了Wasserstein GAN模型和稳定的端到端训练方法以确保训练的稳定性。实验结果证明了该方法的有效性。 TGAN Wasserstein GAN gan 未标记视频 生成式模型 语义表示