小红花·文摘

本研究提出了DiffPano框架，旨在解决3D场景和360度图像生成中的数据不足和复杂性问题。通过建立大规模视频-文本数据集，优化文本到全景的扩散模型，实现了可扩展且一致的全景图像生成。实验结果表明，该方法能够生成多样化且一致的全景图像。

DiffPano: A Scalable and Consistent Text-Based Panorama Generation Method

BriefGPT - AI 论文速递 ·

本文研究360度图像的深度估计，提出了DAMO、OmniFusion和Elite360D等新框架和模型，解决了对象失真和球形畸变问题。通过结合局部与全局特征，利用未标记数据生成伪标签，显著提高了深度估计的准确性，尤其在零样本情况下表现优异。

重新审视360度深度估计：一种新的融合视角

BriefGPT - AI 论文速递 ·

本文研究360度图像的深度估计，提出通过结合360°图像与激光雷达数据创建360Loc数据集，以解决高质量数据集不足的问题，从而提高视觉定位的准确性。同时，介绍了360VOT追踪基准数据集，包含113K帧高分辨率图像，用于评估20种视觉追踪算法的性能。整体上，为360度图像的深度估计和目标追踪提供了新的方法和数据集。

360 度广域：深度预测与视角合成数据集

BriefGPT - AI 论文速递 ·