StyleLipSync是一种基于风格的个性化唇形同步视频生成模型,可以从任意音频生成与身份无关的唇形同步视频。该模型通过引入姿态感知掩蔽和少量样本的唇形同步适应方法,生成准确的唇形同步视频,并增强个人特定的视觉信息。实验证明,该模型在零样本设置下也能增强看不见的面部特征。
StyleLipSync是一个基于风格的个性化唇形同步视频生成模型,可以从任意音频生成与身份无关的唇形同步视频。该模型利用预先训练的StyleGAN生成具有任意身份的视频,引入了姿态感知掩蔽和少量样本的适应方法,提高过帧自然性和泛化性。实验证明,该模型可以生成准确的唇形同步视频,甚至在零样本设置下增强看不见的面部特征。
完成下面两步后,将自动完成登录并继续当前操作。