DreamHead: Learning Spatial-Temporal Correspondence in Audio-Driven Talking Head Synthesis via Hierarchical Diffusion
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了DreamHead框架,旨在改善音频驱动的说话头合成中音频线索与面部表情的时空对应关系。通过预测面部特征点,DreamHead能够有效生成高保真度的说话头视频,具有重要的应用潜力。
🎯
关键要点
-
本研究提出了DreamHead框架,旨在改善音频驱动的说话头合成中音频线索与面部表情的时空对应关系。
-
DreamHead通过预测面部特征点,有效学习音频与面部表情之间的对应关系。
-
该框架能够生成高保真度的说话头视频,具有重要的应用潜力。
➡️