腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放

💡 原文中文,约2900字,阅读约需7分钟。
📝

内容提要

腾讯发布的Sora开源视频生成模型,参数达到130亿,具备超写实画质和流畅运动,已上线元宝APP。用户可申请试用,开发者可通过腾讯云接入,支持多视角切换,适用于广告和创意视频生成。

🎯

关键要点

  • 腾讯发布Sora开源视频生成模型,参数达到130亿,成为目前参数量最大的开源视频生成模型。
  • 模型权重、推理代码和算法全部上传至GitHub与Hugging Face。
  • Sora已上线腾讯元宝APP,用户可申请试用,开发者可通过腾讯云接入。
  • 模型具备超写实画质,适用于广告和创意视频生成等商业应用。
  • 支持高语义一致性,用户可进行细致刻画,准确表达文本内容。
  • 运动画面流畅,生成合理运动,符合物理规律。
  • 具备原生镜头转换功能,自动生成多视角同主体的镜头切换画面。
  • 实测显示模型在复杂场景下表现良好,能够处理大幅度运动和光影效果。
  • 文本编码器适配新一代多模态大语言模型,提升语义跟随能力。
  • 视觉编码器支持混合图片/视频训练,提升压缩重建性能。
  • 采用全注意力机制,提升画面流畅度,支持主体一致的多视角镜头切换。

延伸问答

Sora模型的参数量是多少?

Sora模型的参数量达到130亿。

Sora模型的主要应用场景有哪些?

Sora模型适用于广告宣传和创意视频生成等商业应用。

用户如何申请试用Sora模型?

用户可以在腾讯元宝APP的“AI视频”板块申请试用Sora模型。

Sora模型具备哪些技术特点?

Sora模型具备超写实画质、高语义一致性、流畅运动和原生镜头转换等特点。

Sora模型如何处理复杂场景中的运动?

Sora模型在复杂场景下表现良好,能够生成大幅度合理运动,符合物理规律。

Sora模型的代码和权重在哪里可以找到?

Sora模型的代码和权重已上传至GitHub和Hugging Face。

➡️

继续阅读