TI2V-Zero: 文本到视频扩散模型中的零样本图像调节

原文约300字,阅读约需1分钟。发表于:

提出了 TI2V-Zero:一种无需优化或微调的零样本方法,通过使用预训练的文本到视频扩散模型,使其能够在给定图像的条件下生成实际视频。该方法使用 “重复滑动” 策略来引导视频生成,并提供了一种保持视觉细节的新合成帧初始化和重新采样技术,从而实现视频的逐帧合成。TI2V-Zero 在领域特定和开放领域数据集上的实验证明了其优越性能,并且能够无缝扩展到其他任务和支持长视频生成。

TI2V-Zero是一种无需优化或微调的零样本方法,通过使用预训练的文本到视频扩散模型,在给定图像的条件下生成实际视频。该方法使用“重复滑动”策略来引导视频生成,并提供了一种保持视觉细节的新合成帧初始化和重新采样技术。TI2V-Zero在实验证明了其优越性能,并能够扩展到其他任务和支持长视频生成。

相关推荐 去reddit讨论