Slicedit: 使用时空切片的文本到图像传扩模型的零样本视频编辑
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
我们提出了一种零样本方法,通过预训练的文本到图像扩散模型实现一致的文本到动画角色合成。利用现有的基于文本的动作扩散模型生成多样的动作,并使用其指导文本到图像模型,成功生成了具有不同动作和风格的时序一致的视频,优于现有的零样本文本到视频方法。
🎯
关键要点
-
提出了一种零样本方法,基于预训练的文本到图像扩散模型。
-
实现了一致的文本到动画角色合成。
-
利用现有的基于文本的动作扩散模型生成多样的动作。
-
使用指导文本到图像模型生成时序一致的视频。
-
在像素一致性和用户偏好方面优于现有的零样本文本到视频方法。
🏷️
标签
➡️