本文提出了一种新方法,通过预训练的文字转图像模型生成多视角图像,结合3D体渲染和跨帧注意力层,显著提升3D图像的一致性和视觉质量。研究表明,该方法在3D物体重建上优于现有技术,减少了误差并提高了性能。
完成下面两步后,将自动完成登录并继续当前操作。