梦视频2:零-shot 主题驱动的视频定制与精确运动控制
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了现有视频生成方法在主题学习与运动控制平衡上的问题,提出了一种新的零-shot视频定制框架DreamVideo-2。该框架通过参考注意力与掩码引导运动模块,实现了在不需调试的情况下,基于单一图像和边界框序列生成视频的创新能力,其实验结果显示在主题定制和运动控制上均优于现有方法。
我们提出了CustomVideo框架,可以生成多主题引导的视频。通过在单个图像中组合多个主题,并设计注意力控制策略,解锁潜在空间中的不同主题。我们还使用对象蒙版帮助模型专注于特定区域。我们收集了一个多主题文本到视频生成的数据集作为基准,包含69个单一主题和57个主题对。研究结果表明,该方法优于现有技术。