阿里开源版Sora上线即屠榜,4070就能跑,免费商用

💡 原文中文,约2300字,阅读约需6分钟。
📝

内容提要

阿里开源的Wan 2.1视频生成模型已上线,参数达到14B,支持720P和480P分辨率,适合个人创作者免费商用。该模型能够在视频中生成文字,动作细节表现优异,用户可通过阿里平台体验,采用先进的3D变分自动编码器技术,提升生成效率。

🎯

关键要点

  • 阿里开源的Wan 2.1视频生成模型已上线,参数达到14B。
  • 支持720P和480P分辨率,适合个人创作者免费商用。
  • 模型能够在视频中生成文字,动作细节表现优异。
  • 用户可通过阿里平台体验,采用先进的3D变分自动编码器技术。
  • 14B版本在个人消费级显卡上本地部署较为吃力,但有1.3B小号版本可供选择。
  • 模型支持在视频中生成文字,并根据位置和材质进行合理变化。
  • Wan 2.1采用DiT架构,结合多种策略改善时空压缩,减少内存使用。
  • 实验结果表明,Wan的VAE重建速度比现有方法快2.5倍。
  • 阿里将发布更详细的技术报告,供感兴趣的读者关注。
➡️

继续阅读