任何风格的自由发言

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种无监督的变分风格转换模型 (VAST),以唤醒中性逼真头像的表情。该模型包括风格编码器、混合面部表情解码器和变分风格增强器。实验结果表明,该方法能够产生更生动、真实、丰富表达的说话头像。

🎯

关键要点

  • 提出了一种无监督的变分风格转换模型 (VAST)。

  • 模型包括风格编码器、混合面部表情解码器和变分风格增强器。

  • 风格编码器从视频提示中提取面部风格表示。

  • 混合面部表情解码器模拟与语音相关的动作。

  • 变分风格增强器增强风格空间,提高表达性和寓意性。

  • 模型能够灵活捕捉面部风格,并以零样本方式转移到个性化图像渲染器。

  • 实验结果显示该方法能产生生动、真实、丰富表达的说话头像。

➡️

继续阅读