本文介绍了多种三维人体姿态估计和图像生成技术,包括基于双目视觉的KeyPose网络、改进的单目深度预测模型,以及利用扩散模型生成可控的三维头像。研究展示了在真实环境中生成高质量三维姿态和头像的能力,强调了模型在新视角和表情合成任务中的优势。
完成下面两步后,将自动完成登录并继续当前操作。