OPa-Ma:360 度图像外扩中的文本引导 Mamba

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于状态空间模型 Mamba 的文本引导外推框架,用于解决由单一相机或手机拍摄的传统狭窄视角图像生成 360 度图像的问题。实验结果表明,该方法在室内和室外场景的两个广泛使用的 360 度图像数据集上取得了最先进的性能。

🎯

关键要点

  • 提出了一种基于状态空间模型 Mamba 的文本引导外推框架。
  • 解决了由单一相机或手机拍摄的传统狭窄视角图像生成 360 度图像的问题。
  • 利用长序列建模和空间连续性来克服现有方法的内存使用和计算开销限制。
  • 提高了图像生成的视觉连续性和多样性。
  • 在室内和室外场景的两个广泛使用的 360 度图像数据集上取得了最先进的性能。
➡️

继续阅读