舞蹈融合:用于音频驱动舞蹈动作重建的时空骨架扩散变换器
原文中文,约200字,阅读约需1分钟。发表于: 。本研究解决了短视频平台(如TikTok)中常见的缺失和噪声骨架数据对于舞蹈动作生成的挑战。提出的DanceFusion框架采用分层Transformer变分自编码器与扩散模型的结合,显著提高了运动的真实感和精确度,展示了在动作生成及与音频同步方面的优越性能,有望推动内容创作、虚拟现实和互动娱乐等领域的发展。
本研究提出DanceFusion框架,结合分层Transformer变分自编码器与扩散模型,旨在解决短视频平台中缺失和噪声骨架数据的问题,从而提升舞蹈动作生成的真实感和精确度。