清华与腾讯联合研发的Scene Splatter模型基于视频扩散技术,从单张图像生成高保真3D场景,解决了几何扭曲和一致性问题。该模型通过动量引导生成多视角视频,显著提升三维场景重建效果。
本研究探讨了视觉标记器在图像和视频生成中的扩展问题,提出了一种增强的视觉Transformer架构(ViTok),结果表明解码器的扩展显著提升了重建效果,为未来的视觉生成任务提供了新思路。
本研究提出了一种新方法,解决了高斯模型在稀疏视图3D重建中难以捕捉高频细节的问题,从而显著提升了对象和场景的重建效果。
本研究提出RAWMamba框架,解决sRGB到RAW去渲染中的元数据不兼容问题,通过统一元数据嵌入模块和局部色调感知模块提升RAW数据重建效果,实验结果表明其性能优越。
本文介绍了一种新颖的方法,用于从多个图像中进行3D物体表面重建。该方法通过神经辐射场和预训练的2D扩散模型的指导,引入三个组件来提高重建效果。实验结果显示,该方法在定量和定性上都取得了显著的改进。
完成下面两步后,将自动完成登录并继续当前操作。