潜在变形:用于零样本视频到视频翻译的一致性扩散潜变量
StableVideo是一种文本驱动视频编辑框架,通过引入时态依赖于现有的文本驱动扩散模型,解决了扩散模型在自然视频编辑中编辑现有对象时难以保持其外观随时间稳定的问题。该框架利用分层表示的概念将相邻帧的外观信息传播到下一帧,实现了一致感知的视频编辑。实验证明该方法具有强大的编辑能力,展示了卓越的定性和定量结果。
原文中文,约300字,阅读约需1分钟。
StableVideo是一种文本驱动视频编辑框架,通过引入时态依赖于现有的文本驱动扩散模型,解决了扩散模型在自然视频编辑中编辑现有对象时难以保持其外观随时间稳定的问题。该框架利用分层表示的概念将相邻帧的外观信息传播到下一帧,实现了一致感知的视频编辑。实验证明该方法具有强大的编辑能力,展示了卓越的定性和定量结果。