小红花·文摘

StyleLipSync是一种基于风格的个性化唇形同步视频生成模型，可以从任意音频生成与身份无关的唇形同步视频。该模型通过引入姿态感知掩蔽和少量样本的唇形同步适应方法，生成准确的唇形同步视频，并增强个人特定的视觉信息。实验证明，该模型在零样本设置下也能增强看不见的面部特征。

嘴唇说谎：识别唇同步 DeepFakes 中音频和视觉之间的时间不一致

BriefGPT - AI 论文速递 ·

StyleLipSync是一个基于风格的个性化唇形同步视频生成模型，可以从任意音频生成与身份无关的唇形同步视频。该模型利用预先训练的StyleGAN生成具有任意身份的视频，引入了姿态感知掩蔽和少量样本的适应方法，提高过帧自然性和泛化性。实验证明，该模型可以生成准确的唇形同步视频，甚至在零样本设置下增强看不见的面部特征。

揭示口型不一致的唇同步深度伪造技术

BriefGPT - AI 论文速递 ·