小红花·文摘

本文介绍了多种三维人体姿态估计和图像生成技术，包括基于双目视觉的KeyPose网络、改进的单目深度预测模型，以及利用扩散模型生成可控的三维头像。研究展示了在真实环境中生成高质量三维姿态和头像的能力，强调了模型在新视角和表情合成任务中的优势。