自监督学习潜在表示中的偏差以生成共语手势视频
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
论文介绍了为 GENEA Challenge 2023 开发的系统,使用扩散式运动合成模型。提出的对比语言和动作预训练(CSMP)模块学习语言和手势的联合嵌入,理解模态间的语义关系。CSMP 输出作为条件信号用于手势合成,实现语义感知的手势生成。系统在比赛中获得最高的人类相似度和语言适应性评分,显示出生成类人手势的潜力。
🎯
关键要点
-
论文描述了为 GENEA Challenge 2023 开发的系统,基于扩散式运动合成模型。
-
提出了对比语言和动作预训练(CSMP)模块,学习语言和手势的联合嵌入。
-
CSMP 模块旨在理解模态间的语义耦合关系。
-
CSMP 输出作为条件信号用于手势合成,实现语义感知的手势生成。
-
系统在比赛中获得最高的人类相似度和语言适应性评分,显示出生成类人手势的潜力。
🏷️
标签
➡️