重新捕捉:通过掩蔽视频微调为用户提供的视频生成可控视频摄像机控制

原文中文,约500字,阅读约需2分钟。发表于:

本研究解决了如何从用户提供的非生成视频中生成具有新摄像机轨迹的新视频的问题。提出的ReCapture方法利用多视角扩散模型和掩蔽视频微调技术,实现从单个用户视频重新生成不同角度的视频,并可以合理地虚构参考视频中未观察到的场景部分。研究的重大发现是,可以有效地实现电影风格的摄像机运动并保持时间一致性。

我们提出了一种无需训练的摄像机运动控制方案,适用于现成的视频扩散模型。该方法仅需一个图像或文本提示即可生成可控视频。通过重排噪点像素,实现了稳健的摄像机控制,并在生成动态三维旋转视频方面取得显著成果。

相关推荐 去reddit讨论