任何风格的自由发言
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种无监督的变分风格转换模型 (VAST),以唤醒中性逼真头像的表情。该模型包括风格编码器、混合面部表情解码器和变分风格增强器。实验结果表明,该方法能够产生更生动、真实、丰富表达的说话头像。
🎯
关键要点
-
提出了一种无监督的变分风格转换模型 (VAST)。
-
模型包括风格编码器、混合面部表情解码器和变分风格增强器。
-
风格编码器从视频提示中提取面部风格表示。
-
混合面部表情解码器模拟与语音相关的动作。
-
变分风格增强器增强风格空间,提高表达性和寓意性。
-
模型能够灵活捕捉面部风格,并以零样本方式转移到个性化图像渲染器。
-
实验结果显示该方法能产生生动、真实、丰富表达的说话头像。
➡️