小红花·文摘

本研究提出了多个框架和模型，以提高语音驱动的共语手势生成效果。通过引入多模态预训练、情感线索和运动解耦技术，研究在手势合成、生成质量和速度方面取得了显著提升，尤其是在直接生成3D手势方面。