CustomVideo: 多主题文本生成定制视频
原文中文,约400字,阅读约需1分钟。发表于: 。在本工作中,我们提出了一种名为 CustomVideo...
本文介绍了一种名为CustomVideo的新型框架,可以生成多个主题引导下的保持身份特征的视频。通过将多个主题组合于单个图像中,促进多主题同时出现;设计了一种简单而有效的注意力控制策略,解开不同主题;从给定的参考图像中分割对象,并为注意力学习提供相应的对象蒙版。收集了一个多主题文本到视频生成数据集作为基准,证明了该方法的优越性。
在本工作中,我们提出了一种名为 CustomVideo...
本文介绍了一种名为CustomVideo的新型框架,可以生成多个主题引导下的保持身份特征的视频。通过将多个主题组合于单个图像中,促进多主题同时出现;设计了一种简单而有效的注意力控制策略,解开不同主题;从给定的参考图像中分割对象,并为注意力学习提供相应的对象蒙版。收集了一个多主题文本到视频生成数据集作为基准,证明了该方法的优越性。