本研究提出了“意图手势”框架,解决了手势生成方法中忽视交流意图的问题。通过高层次意图推理和手势意图注解,实现了更深层次的手势合成,并在BEAT-2基准测试中取得了先进表现,推动了数字人类和人工智能领域的发展。
该研究提出了SARGes框架,解决语音同步手势合成中的语义手势生成问题。通过大型语言模型解析语音,SARGes实现了50.2%的手势标注准确率,证明了其在语义手势合成中的有效性。
本研究提出ExGes框架,优化音频驱动的人类手势合成,解决了粗糙性和表现性不足的问题。通过构建手势库和应用对比学习等技术,显著提升了生成手势的自然性和语义相关性,实验结果表明其优于现有方法。
本研究提出了一种基于检索增强生成(RAG)的手势生成方法RAG-Gesture,旨在解决现有神经系统在生成语义丰富手势方面的不足。该方法结合可解释的语言知识和示例运动库,实现自然且富有语义的手势生成,推动手势合成领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。