本文提出了一种名为PointTalk的3D高斯方法,旨在解决数字人类领域中基于任意语音音频的对话头合成问题。该方法通过静态3D高斯场与音频同步变形,并引入动态唇部点云,显著提升了合成的高保真度和音频与唇部的同步性能。
完成下面两步后,将自动完成登录并继续当前操作。