本文提出了一种以人为中心的多模态对比学习框架,旨在通过样本对比学习实现多视角数据的特征表示,以支持3D姿态估计任务的合成数据生成。研究表明,使用合成图像训练的CNN在3D姿态估计上表现优于使用真实图像训练。此外,提出的StylePoseGAN能够合成具有姿势控制的人类图像,适用于虚拟换装等应用。
完成下面两步后,将自动完成登录并继续当前操作。