小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新颖的全端到端口型同步框架LatentSync，基于音频条件的潜在扩散模型，旨在提高时序一致性和口型同步的准确性。

LatentSync: Lip Syncing Based on Audio-Conditioned Latent Diffusion Model

BriefGPT - AI 论文速递 ·