小红花·文摘

本文提出了一种名为PointTalk的3D高斯方法，旨在解决数字人类领域中基于任意语音音频的对话头合成问题。该方法通过静态3D高斯场与音频同步变形，并引入动态唇部点云，显著提升了合成的高保真度和音频与唇部的同步性能。