SynthoGestures: 面向驾驶场景的合成动态手势生成新框架

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于手势模板和语音音频的手势序列生成方法,使用嘴唇同步误差来评估模型的同步能力。该方法在保真度和同步性方面表现良好。

🎯

关键要点

  • 提出了一种基于手势模板和语音音频的共同生成手势序列方法。
  • 使用嘴唇同步误差作为代理度量来评估模型的同步能力。
  • 通过对齐生成的手势序列和语音音频来评估同步性。
  • 该方法在保真度和同步性方面表现良好,获得了更好的客观和主观评价。
➡️

继续阅读