Compress3D:来自单张图像的 3D 生成的压缩潜空间
原文中文,约300字,阅读约需1分钟。发表于: 。通过使用 triplane 自编码器将 3D 模型编码为紧凑的 triplane 潜空间,本文提出了一种有效压缩 3D 几何和纹理信息的方法,并引入了 3D 感知交叉注意机制,从高分辨率的 3D 特征体积中查询特征,提高了潜空间的表示能力。同时利用图像嵌入和形状嵌入作为条件,通过扩散先验模型估计形状嵌入,实现了优于现有算法的性能,且仅在单个 A100 GPU 上耗时 7 秒。
本文介绍了一种使用triplane自编码器将3D模型编码为紧凑的triplane潜空间的方法,有效压缩了3D几何和纹理信息。同时引入了3D感知交叉注意机制,提高了潜空间的表示能力。利用图像嵌入和形状嵌入作为条件,通过扩散先验模型估计形状嵌入,实现了优于现有算法的性能。仅在单个A100 GPU上耗时7秒。