Text-Animator: 可控的视觉文本视频生成
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了一种创新的方法 Text-Animator,用于视觉文本视频生成,通过精确描述生成视频中视觉文本的结构,并通过控制摄像机移动和文本运动来改善生成视觉文本的稳定性,实验证明了我们方法在生成视觉文本准确性上的优越性。
最近,研究提出了一种新的多文本视频生成模型,通过利用预训练的文本到视频转换模型进行生成。该方法包括动态噪声和最后一帧感知反演,以保持视觉一致性并防止重复运动或内容。实验证明该方法在生成输出方面具有出色的语义一致性和时间连续性。