小红花·文摘

本研究提出了DiffPano框架，旨在解决3D场景和360度图像生成中的数据不足和复杂性问题。通过建立大规模视频-文本数据集，优化文本到全景的扩散模型，实现了可扩展且一致的全景图像生成。实验结果表明，该方法能够生成多样化且一致的全景图像。