小红花·文摘

谷歌发布了VLOGGER，一种能将照片转化为动态视频的新技术。VLOGGER使用两个AI，Lipreader和Animator，具备图像到视频、视频翻译和视频编辑等功能。VLOGGER需要真实人物照片，无法创造虚构人物。目前VLOGGER还是一个研究项目。

谷歌刚刚发布让照片动起来的VLOGGER

极道 ·

本文介绍了Vlogger，一个通用的人工智能系统，能够生成用户描述的分钟级视频博客。该系统利用大型语言模型分解视频生成任务，并引入新的视频传播模型ShowMaker，以提升视频片段的一致性。实验证明，Vlogger在生成和预测任务上表现优异，能够生成超过5分钟的连贯vlogs。此外，研究还探讨了3D可变模型在生成逼真头像和虚拟人物动作中的应用，展示了在细节和表现力上的优势。

VLOGGER: 身体化头像合成的多模态扩散

BriefGPT - AI 论文速递 ·

Vlogger是一个通用的人工智能系统，用于生成用户描述的分钟级视频博客。它通过智能地利用大型语言模型作为导演，将视频生成任务分解为四个关键阶段，并通过引入文本和视觉提示来提高片段的时空一致性。实验证明，Vlogger在零样本T2V生成和预测任务上达到了最先进的性能，并且能够从开放世界描述中生成超过5分钟的vlogs，保持视频的连贯性。

记录生活：实现你的 Vlog 梦想

BriefGPT - AI 论文速递 ·