开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了

开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了

💡 原文中文,约900字,阅读约需3分钟。
📝

内容提要

上海人工智能实验室发布了“书生・筑梦 2.0”视频生成模型,支持生成5至20秒、分辨率720x480的视频,并兼容多种格式。其VEnhancer算法集成插帧、超分辨率和修复功能,可生成2K分辨率视频。模型优化了长视频生成评测,性能媲美开源最佳模型。

🎯

关键要点

  • 上海人工智能实验室推出新一代视频生成大模型“书生・筑梦 2.0”。
  • 支持生成5至20秒长的视频,分辨率高达720x480。
  • 兼容多种视频格式,包括横屏、竖屏等,扩展应用场景。
  • 新一代视频增强算法VEnhancer集成插帧、超分辨率和修复功能。
  • VEnhancer可生成2K分辨率、24fps的视频,提升视频稳定性。
  • 全球首个支持长视频生成评测的框架,优化了对长视频生成的评测能力。
  • 书生・筑梦 2.0在开源2B模型中表现卓越,性能媲美开源最优的5B模型。
➡️

继续阅读