PoseTalk:基于文本和音频的姿势控制与动作细化的一次性对话头生成

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本研究提出了高效解开耦合框架(EDTalk)用于言语生成,能够分解面部动态并对嘴型、头部姿势和情绪表达进行个别操作。通过三个轻量级模块将面部动态分解为嘴部、姿势和表情的三个独立潜在空间,并利用可学习的基向量对每个空间内的特定运动进行定义。实验证明了EDTalk的有效性。

原文中文,约300字,阅读约需1分钟。
阅读原文