小红花·文摘

全景视频是虚拟现实的重要组成部分，提升用户体验。尽管制作需要专业设备，但生成式视频模型的进展降低了创作门槛。北京大学推出的PanoWan框架，通过纬度感知采样等技术，解决了全景视频生成中的畸变问题，并构建了包含1.3万视频的PanoVid数据集，提升了生成效果和编辑能力。

基于 1.3 万个视频片段，北京大学施柏鑫团队联合贝式计算提出全景视频生成框架 PanoWan，兼顾零样本视频编辑

HyperAI超神经 ·

北京大学施柏鑫团队与OpenBayes合作推出PanoWan框架，通过文本引导生成全景视频，解决了生成过程中的畸变和不连贯问题，采用纬度感知采样和边界填充技术。同时，团队构建了包含1.3万个视频片段的PanoVid数据集，推动VR内容创作的发展。

基于1.3万个视频片段，北大施柏鑫团队联合贝式计算提出全景视频生成框架PanoWan，兼顾零样本视频编辑

HyperAI超神经 ·

本研究提出VideoPanda方法，解决虚拟现实中高分辨率全景视频生成的挑战。该方法通过多视角注意力层增强视频扩散模型，实现基于文本或单视角视频生成一致的多视角视频，生成的360°全景图像更真实连贯。

VideoPanda: Multi-View Attention-Based Video Panorama Diffusion

BriefGPT - AI 论文速递 ·

视频前沿技术

蒲小花的博客 ·

本文介绍了一种新方法，利用单张卫星图像和相机轨迹合成具有时间和几何一致性的全景视频。该方法使用3D点云表示场景，并通过生成的稠密三维到二维相对应关系实现几何和时间上的一致性。同时使用级联网络和两个Hourglass模块生成粗特征和细特征，最终生成逼真的视频。该方法在实验中表现出优异的结果，超越了其他合成方法，并且是首个成功将跨视角图像合成为视频的方法。

利用街景视频序列自动构建交通分析的时空图

BriefGPT - AI 论文速递 ·