腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
💡
原文中文,约2900字,阅读约需7分钟。
📝
内容提要
腾讯发布的Sora开源视频生成模型,参数达到130亿,具备超写实画质和流畅运动,已上线元宝APP。用户可申请试用,开发者可通过腾讯云接入,支持多视角切换,适用于广告和创意视频生成。
🎯
关键要点
- 腾讯发布Sora开源视频生成模型,参数达到130亿,成为目前参数量最大的开源视频生成模型。
- 模型权重、推理代码和算法全部上传至GitHub与Hugging Face。
- Sora已上线腾讯元宝APP,用户可申请试用,开发者可通过腾讯云接入。
- 模型具备超写实画质,适用于广告和创意视频生成等商业应用。
- 支持高语义一致性,用户可进行细致刻画,准确表达文本内容。
- 运动画面流畅,生成合理运动,符合物理规律。
- 具备原生镜头转换功能,自动生成多视角同主体的镜头切换画面。
- 实测显示模型在复杂场景下表现良好,能够处理大幅度运动和光影效果。
- 文本编码器适配新一代多模态大语言模型,提升语义跟随能力。
- 视觉编码器支持混合图片/视频训练,提升压缩重建性能。
- 采用全注意力机制,提升画面流畅度,支持主体一致的多视角镜头切换。
❓
延伸问答
Sora模型的参数量是多少?
Sora模型的参数量达到130亿。
Sora模型的主要应用场景有哪些?
Sora模型适用于广告宣传和创意视频生成等商业应用。
用户如何申请试用Sora模型?
用户可以在腾讯元宝APP的“AI视频”板块申请试用Sora模型。
Sora模型具备哪些技术特点?
Sora模型具备超写实画质、高语义一致性、流畅运动和原生镜头转换等特点。
Sora模型如何处理复杂场景中的运动?
Sora模型在复杂场景下表现良好,能够生成大幅度合理运动,符合物理规律。
Sora模型的代码和权重在哪里可以找到?
Sora模型的代码和权重已上传至GitHub和Hugging Face。
➡️