华为云官方博客 ·

一键Run带你体验扩散模型的魅力

💡 原文中文，约11700字，阅读约需28分钟。

📝

内容提要

华为云社区分享了OpenAI最新发布的文本生成视频模型Sora，它可以生成长达一分钟的高质量视频。Sora采用变压器架构，能够处理不同分辨率和宽高比的视频和图像。Sora的技术思路独特，注重语义理解的变化，展示了技术的无限可能性。开发者用户可以在华为云上体验Stable Video Diffusion (SVD)扩散模型，生成视频并转成动图。

🎯

关键要点

Sora是OpenAI最新发布的文本生成视频模型，能够生成长达一分钟的高质量视频。
Sora采用变压器架构，处理不同分辨率和宽高比的视频和图像。
Sora的技术思路注重语义理解的变化，展示了技术的无限可能性。
Sora将带来短视频创作的智能化变革，降低创作难度和成本。
Sora背后的模型基于Diffusion Transformer Model，结合了Transformer架构和扩散模型。
Sora的成功依赖于训练数据和解决错误累积问题的能力。
开发者可以在华为云上体验Stable Video Diffusion (SVD)扩散模型，生成视频并转成动图。
Stable Video Diffusion (SVD)将静止图像作为条件帧生成视频，需使用Pytorch-1.8及以上规格运行。
用户需注册华为云账号并进行实名认证才能体验SVD。
生成的视频默认保存到outputs文件夹内，用户可以将视频转成动图显示。

❓

延伸问答

Sora是什么模型，它的主要功能是什么？

Sora是OpenAI最新发布的文本生成视频模型，能够生成长达一分钟的高质量视频，并遵循用户的提示保持视觉质量。

Sora的技术架构是什么？

Sora采用变压器架构，结合了Diffusion Transformer Model，能够处理不同分辨率和宽高比的视频和图像。

如何在华为云上体验Stable Video Diffusion (SVD)模型？

用户需注册华为云账号并进行实名认证，然后在ModelArts中点击Run体验SVD模型。

Sora如何改变短视频创作的生态？

Sora将带来短视频创作的智能化变革，降低创作难度和成本，拓展创作者的能力边界。

Sora的成功依赖于哪些因素？

Sora的成功依赖于训练数据的质量和解决错误累积问题的能力。

用户生成的视频保存在哪里？

生成的视频默认保存到outputs文件夹内。

🏷️