本研究提出了PoseSyn,一个创新的数据合成框架,旨在解决现有数据增强方法在真实场景中对复杂人类姿势适应性不足的问题。PoseSyn通过利用自然2D姿势数据生成多样的3D姿势图像对,显著提高了3D姿势估计器的准确性,最多可提升14%。
该文章介绍了一种以姿势感知损失为基础的学习方法,用于生成符合音乐的舞蹈视频。通过使用两个区分器来捕捉序列的不同方面,并引入新的姿势感知损失来产生自然的舞蹈,同时还提供了一种新的跨模态评估方法来评估舞蹈质量。通过用户研究证明,该方法生成的舞蹈视频具有惊人的逼真效果。
完成下面两步后,将自动完成登录并继续当前操作。