量子位 ·

CVPR 2025：单图秒变专业影棚，几何/材质/光影全搞定，数据代码开源

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

香港中文大学等团队研发的Neural LightRig，利用图像扩散模型生成多光照图像，解决了单图法线和材质估计的不确定性。实验结果表明，该方法在法线和材质估计上显著优于现有技术，适用于AR和VR领域，相关资源已开源。

🎯

🔎

Neural LightRig的研发背景源于计算机视觉领域对单图法线和材质估计的长期挑战。传统方法依赖多角度拍摄，限制了其在日常应用中的可行性。该项目通过图像扩散模型的创新应用，成功生成虚拟多光照图像，显著降低了估计过程中的不确定性，推动了技术的进步。

Neural LightRig在AR和VR领域的应用潜力巨大。其高效的法线和材质估计能力，使得在虚拟环境中创建真实感更强的物体成为可能。这一技术的普及将为数字内容创作带来新的机遇，尤其是在游戏和影视制作等行业。

研究团队已将Neural LightRig的相关资源开源，鼓励社区进行探索与应用。这不仅促进了技术的传播，也为研究人员提供了宝贵的工具和数据集，推动了计算机视觉领域的进一步发展。开源的做法有助于加速创新和合作。

❓

Neural LightRig旨在从单幅图像中准确估计物体的三维法线和材质属性，解决传统方法的局限性。

该项目利用图像扩散模型生成虚拟多光照图像，从而有效减少单图估计过程中的不确定性。

实验结果显示，Neural LightRig在法线和材质估计上显著优于现有技术，法线估计的平均角度误差降低至6.413°。

研究团队已开源代码、数据集和预训练模型，相关资源可在GitHub和Hugging Face找到。

该方法适用于增强现实（AR）、虚拟现实（VR）和数字内容创作等广泛领域。

Neural LightRig创新性地提出通过微调预训练的图像扩散模型生成一致性多光照图像序列，解决了单图法线和材质估计的不确定性。

🏷️