MVDream是一个多视图扩散模型,生成几何一致的多视图图像。利用预训练的图像扩散模型和3D资源渲染的多视图数据集,实现2D扩散的概括性和3D数据的一致性。解决现有方法中的3D一致性问题,并可用于个性化的3D生成。
本文提出了一种基于编码器的文本到图像(T2I)个性化生成方法,使用对比度正则化技术实现目标概念特征的高保真度,并保持预测的嵌入值在可编辑的潜在空间区域,实现基于CLIP标记的最短距离。实验证明该方法有效且比未规范化模型预测的标记更具语义性,表现出最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。