小红花·文摘

本文介绍了一种名为MCM的框架，结合了多种条件输入，如文本、音乐、语音等，实现了多条件人体动作合成任务。同时，引入了一种基于Transformer的扩散模型MWNet，通过自注意力模块捕捉运动序列中的空间复杂性和关节之间的相关性。实验结果表明，该方法在文本到动作任务中取得了SOTA结果，在音乐到舞蹈任务中也取得了竞争性结果。同时，MCM还实现了有效的多条件模态控制，训练一次即可生成无限动作。

基于多条件扩散模型的语言驱动场景合成

BriefGPT - AI 论文速递 ·

本文介绍了一种多条件人体动作合成任务的方法，通过结合多样的条件输入，如文本、音乐、语音等，使任务适应于多种场景。实验结果表明，该方法在文本到动作任务中取得了最先进的结果，并在音乐到舞蹈任务中也表现出竞争性的结果。定性评估显示，该方法简化了原本设计用于文本到动作任务的方法在其他领域的适应性，并实现了有效的多条件模态控制。

MCM：多情景多条件动作合成框架

BriefGPT - AI 论文速递 ·