论文介绍了为 GENEA Challenge 2023 开发的系统,使用扩散式运动合成模型。提出的对比语言和动作预训练(CSMP)模块学习语言和手势的联合嵌入,理解模态间的语义关系。CSMP 输出作为条件信号用于手势合成,实现语义感知的手势生成。系统在比赛中获得最高的人类相似度和语言适应性评分,显示出生成类人手势的潜力。
完成下面两步后,将自动完成登录并继续当前操作。