小红花·文摘

本文提出了无监督的变分风格转换模型(VAST)，用于唤醒中性逼真头像的表情。该模型包括风格编码器、混合面部表情解码器和变分风格增强器。实验结果显示，该方法能够生成更生动、真实、丰富表达的说话头像。

BriefGPT - AI 论文速递 ·

本论文介绍了DiffPoseTalk生成框架，利用扩散模型和风格编码器生成面部动画，并通过语音和风格指导提高用户感知。作者通过训练高质量音频-视觉数据集解决了扫描3D说话脸数据不足的问题。实验和用户研究表明该方法优于现有方法。

BriefGPT - AI 论文速递 ·

本文提出了一种无监督的变分风格转换模型 (VAST)，以唤醒中性逼真头像的表情。该模型包括风格编码器、混合面部表情解码器和变分风格增强器。实验结果表明，该方法能够产生更生动、真实、丰富表达的说话头像。

BriefGPT - AI 论文速递 ·

DiffPoseTalk是一种生成框架，利用扩散模型和风格编码器辅助面部动画生成。通过语音和风格指导生成过程，提高用户感知。作者通过训练高质量音频-视觉数据集中的3DMM参数解决了扫描3D说话脸数据不足的问题。实验和用户研究表明该方法优于现有方法。代码和数据集将公开发布。

BriefGPT - AI 论文速递 ·