HyperAI超神经 ·

基于1.3万个视频片段，北大施柏鑫团队联合贝式计算提出全景视频生成框架PanoWan，兼顾零样本视频编辑

💡 原文中文，约5100字，阅读约需13分钟。

📝

内容提要

北京大学施柏鑫团队与OpenBayes合作推出PanoWan框架，通过文本引导生成全景视频，解决了生成过程中的畸变和不连贯问题，采用纬度感知采样和边界填充技术。同时，团队构建了包含1.3万个视频片段的PanoVid数据集，推动VR内容创作的发展。

🎯

🔎

全景视频作为虚拟现实的重要内容形式，能够提供360°的沉浸式体验，增强用户的代入感。随着PanoWan框架的推出，制作全景视频的门槛大幅降低，这将促进VR内容的普及和发展，推动相关产业的创新与应用。

PanoWan框架通过纬度感知采样和边界填充技术，有效解决了全景视频生成中的畸变和不连贯问题。这种技术创新不仅提升了生成视频的质量，也为后续的零样本视频编辑提供了强大的支持，显示出其在实际应用中的广泛潜力。

PanoVid数据集汇聚了超过1.3万个高质量视频片段，涵盖多样化场景，为全景视频生成提供了丰富的训练素材。这一数据集的构建不仅解决了数据稀缺的问题，也为研究人员和开发者提供了宝贵的资源，推动了全景视频技术的进一步发展。

❓

PanoWan框架通过文本引导生成全景视频，解决了生成过程中的畸变和不连贯问题。

PanoVid数据集包含超过1.3万个带有文字描述的视频片段，涵盖自然风景、城市街景和人物活动等多样化场景。

PanoWan采用纬度感知采样技术和边界填充逐像素解码策略，有效降低画面畸变和视觉不连贯性。

PanoWan在文本生成全景视频任务上表现出最佳性能，并具备强大的零样本视频编辑能力。

PanoWan的开发团队由北京大学施柏鑫团队和OpenBayes贝式计算组成，施柏鑫团队在计算摄像学与计算机视觉领域有丰富的研究成果。

PanoWan可应用于全景视频的长视频生成、超分辨率、语义编辑和视频外扩等多个实用场景。

🏷️