本研究提出了多个框架和模型,以提高语音驱动的共语手势生成效果。通过引入多模态预训练、情感线索和运动解耦技术,研究在手势合成、生成质量和速度方面取得了显著提升,尤其是在直接生成3D手势方面。
完成下面两步后,将自动完成登录并继续当前操作。