MTVG: 多文本视频生成与文本到视频模型

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

研究人员提出了一种新的多文本视频生成模型,利用预训练的文本到视频转换模型进行生成。该方法通过动态噪声和最后一帧感知反演保持视觉一致性和防止重复运动或内容。实验证明该方法在生成输出方面具有出色的语义一致性和时间连续性。

原文中文,约500字,阅读约需2分钟。
阅读原文