本研究提出DiffPano框架,旨在解决3D场景和360度图像生成中的数据集不足和复杂性问题。通过利用大规模视频-文本数据集和稳定扩散技术,实现了一致且多样的全景图像生成。
本文提出了一种基于状态空间模型 Mamba 的文本引导外推框架,用于解决由单一相机或手机拍摄的传统狭窄视角图像生成 360 度图像的问题。实验结果表明,该方法在室内和室外场景的两个广泛使用的 360 度图像数据集上取得了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。