小红花·文摘

本文提出了一种名为PointTalk的3D高斯方法，旨在解决数字人类领域中基于任意语音音频的对话头合成问题。该方法通过静态3D高斯场与音频同步变形，并引入动态唇部点云，显著提升了合成的高保真度和音频与唇部的同步性能。

BriefGPT - AI 论文速递 ·

该文章介绍了一种基于扩散变压器的新型对话头合成流程，利用音频驱动扩散模型的去噪过程。该方法可推广到多个身份，产生高质量的结果。与现有方法相比，该模型在视觉质量和嘴唇同步准确性方面具有竞争力。该方法在虚拟助手、娱乐和教育等领域有潜力。

BriefGPT - AI 论文速递 ·