BriefGPT - AI 论文速递 ·

TI2V-Zero: 文本到视频扩散模型中的零样本图像调节

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

本文介绍了AnimateZero，一种基于预训练文本到视频扩散模型的零样本方法，能够高效生成图像动画。该方法无需额外训练，支持交互式视频生成，且在视频生成中表现出更好的像素一致性和用户偏好，推动了视频生成技术的发展。

🎯

❓

AnimateZero 是一种基于预训练文本到视频扩散模型的零样本方法，能够高效生成图像动画。

AnimateZero 通过解耦视频为特定外观与相应动作的图像动画，提供更精确的外观和动作控制能力。

该方法无需进一步训练，支持交互式视频生成，并在像素一致性和用户偏好方面表现优于现有方法。

实验表明，AnimateZero 在文本到视频生成及相关应用中具有有效性，优于现有的零样本文本到视频方法。

开源的视频生成模型包括文本到视频和图像到视频两种扩散模型，能够生成高分辨率、逼真且影片般质量的视频。

AnimateZero 可以实现多种新应用，包括交互式视频生成和真实图像动画。

🏷️