SlowFast-VGen:面向动作驱动的长视频生成的慢速-快速学习
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了现有视频生成模型在长视频生成中对快速学习阶段的忽视问题。我们提出了SlowFast-VGen,这是一种新颖的双速学习系统,结合了慢速学习的世界动态模型和快速学习的时序LoRA模块以高效存储情景记忆。实验表明,该方法在各种指标上优于基线模型,显著提高了长视频生成的一致性和任务执行能力。
本研究提出了SlowFast-VGen,解决了现有视频生成模型在长视频生成中忽视快速学习阶段的问题。该系统结合了慢速学习和快速学习模块,显著提升了长视频生成的一致性和任务执行能力。