LaVie是一个整合的视频生成框架,利用预训练的文本到图像模型生成高质量的文本到视频模型。LaVie通过时间自注意机制和联合图像-视频微调生成逼真且时间连贯的视频,并保留预训练模型的创造性。经实验证明,LaVie在性能上表现出色,适用于长视频生成和个性化视频合成应用。
InteractiveVideo是一个用户中心的视频生成框架,通过动态交互允许用户指导生成模型。它提供协同多模态指导机制,促进用户输入和生成过程之间的合作和响应交互。用户可以定制视频的关键方面,如绘制参考图像、编辑语义和调整视频动作。
完成下面两步后,将自动完成登录并继续当前操作。