量子位 ·

一张图0.1秒生成上半身3D化身！清华IDEA新框架入选ICCV 2025

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

清华大学IDEA团队提出的GUAVA框架能够在0.1秒内从单张图像生成上半身3D化身，支持实时动画和渲染。GUAVA引入EHM模型，显著提升面部表情捕捉能力，实验结果显示其在渲染质量和效率上优于现有方法，相关代码已开源。

🎯

🔎

GUAVA框架的推出标志着3D化身生成技术的一次重大突破。与传统方法相比，它无需多视角视频或单人训练，极大地降低了技术门槛。这使得在电影、游戏和虚拟会议等领域，用户能够更快速地生成个性化的3D化身，提升了用户体验和互动性。

GUAVA支持实时动画和渲染，这一特性使其在虚拟现实和增强现实应用中具有广泛的潜力。随着技术的进步，未来可能会在社交媒体、在线教育等领域实现更生动的互动体验，推动数字内容创作的变革。

尽管GUAVA在渲染质量和效率上表现优异，但仍需关注其在复杂场景下的表现。对于极端姿势或未见区域的处理能力，虽然已有改进，但在实际应用中可能仍会遇到挑战。因此，未来的研究可以进一步优化其鲁棒性和适应性。

❓

GUAVA框架能够在0.1秒内从单张图像生成上半身3D化身，并支持实时动画和渲染。

GUAVA引入了EHM模型，结合了SMPLX和FLAME模型，能够实现更准确的面部表情表示。

GUAVA在渲染质量和效率上优于现有2D和3D方法，重建时间约为0.1秒，支持实时应用。

GUAVA通过单次前向推理方式完成重建，使用两个分支生成高斯，结合逆纹理映射技术捕捉细节。

实验显示GUAVA在所有指标上表现最佳，动画和渲染速度达到约50 FPS，重建时间仅为0.1秒。

是的，GUAVA的相关代码已开源，感兴趣者可以进一步关注。

🏷️