小红花·文摘

本文提出了一种以人为中心的多模态对比学习框架，旨在通过样本对比学习实现多视角数据的特征表示，以支持3D姿态估计任务的合成数据生成。研究表明，使用合成图像训练的CNN在3D姿态估计上表现优于使用真实图像训练。此外，提出的StylePoseGAN能够合成具有姿势控制的人类图像，适用于虚拟换装等应用。