CamFreeDiff: 无摄像头的基于扩散模型的图像拼接生成
原文中文,约400字,阅读约需1分钟。发表于: 。该论文介绍了一种针对 360 度图像补全的无需相机的扩散模型,通过预测输入视图到预定义规范视图的单应性变换,并利用该单应性变换提供输入图像与目标全景图像之间的点级对应关系,在差分扩散框架中利用注意力机制进行连接,实现了对无相机输入条件下 360 度图像补全的鲁棒性和泛化能力的定性和定量实验结果的展示。
本文介绍了一种360度室内RGB全景图像外扩模型IPO-LDM,使用潜在扩散模型对缺少深度信息的RGB图像进行外扩,并通过渐进式相机旋转改善全景图的一致性。实验结果表明,IPO-LDM优于现有方法,在RGB全景图像外扩方面能生成多个多样且结构良好的结果。