Slicedit: 使用时空切片的文本到图像传扩模型的零样本视频编辑

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

我们提出了一种零样本方法,通过预训练的文本到图像扩散模型实现一致的文本到动画角色合成。利用现有的基于文本的动作扩散模型生成多样的动作,并使用其指导文本到图像模型,成功生成了具有不同动作和风格的时序一致的视频,优于现有的零样本文本到视频方法。

🎯

关键要点

  • 提出了一种零样本方法,基于预训练的文本到图像扩散模型。

  • 实现了一致的文本到动画角色合成。

  • 利用现有的基于文本的动作扩散模型生成多样的动作。

  • 使用指导文本到图像模型生成时序一致的视频。

  • 在像素一致性和用户偏好方面优于现有的零样本文本到视频方法。

➡️

继续阅读