为面部注入生命:利用自然头部姿势和详细形状进行由语音驱动的 3D 面部动画
原文中文,约400字,阅读约需1分钟。发表于: 。VividTalker 是一个新框架,旨在辅助具有灵活头部姿势和自然面部细节的以语音驱动的 3D 面部动画,通过将面部动画显式地分解为头部姿势和口腔运动,并将其单独编码为离散潜在空间,然后利用基于窗口的 Transformer 架构通过自回归过程生成这些特征。在与语音内容一致的情况下,使用新的 3D...
VividTalker是一个新框架,用于以语音驱动的3D面部动画。它使用基于窗口的Transformer架构生成头部姿势和口腔运动的特征,并利用新的3D数据集构建面部细节合成。实验证明,VividTalker胜过了现有最先进的方法,实现了生动逼真的3D面部动画。