机器之心 ·

20万美元商业级视频生成大模型Open-Sora 2.0来了，权重、推理代码及训练流程全开源！

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

潞晨科技推出Open-Sora 2.0，这是一款开源视频生成模型，使用20万美元训练出11B参数的商业级模型，性能与高成本闭源模型相当。该模型降低了视频生成成本，提升了可及性，全面开源代码和权重，推动了视频生成技术的发展。

🎯

🔎

Open-Sora 2.0的发布标志着视频生成技术的开源革命。与传统高成本闭源模型相比，它以更低的训练成本和开源的方式，提升了视频生成的可及性。这为开发者和企业提供了更多的选择，推动了整个行业的创新与发展。

Open-Sora 2.0采用了3D自编码器和Flow Matching训练框架，结合高效的并行训练方案，显著提升了训练效率。这种架构不仅降低了训练成本，还提高了模型的生成质量，展示了技术创新在实际应用中的重要性。

高压缩比自编码器的应用是Open-Sora 2.0的一大亮点，它将推理速度提升了10倍。这一技术的成功实现，可能会成为未来视频生成领域降低成本和提升效率的关键方向，值得开发者关注与探索。

❓

Open-Sora 2.0的训练成本为20万美元。

Open-Sora 2.0在性能上与高成本闭源模型相当，同时大幅降低了训练成本，提升了可及性。

Open-Sora 2.0的参数规模为11B。

Open-Sora 2.0采用了3D自编码器和Flow Matching训练框架，并引入了3D全注意力机制。

Open-Sora 2.0通过高压缩比自编码器的应用，大幅降低了推理成本，推理速度提升了10倍。

用户可以通过访问Open-Sora的GitHub开源仓库参与社区，探索AI视频的未来。

🏷️