智驾公司下场搞AI视频生成,模型上线即开源

智驾公司下场搞AI视频生成,模型上线即开源

💡 原文中文,约2800字,阅读约需7分钟。
📝

内容提要

图森未来推出开源视频生成模型Ruyi,用户可上传图片生成720P、5秒视频,支持多种风格,表现良好但存在细节问题。该公司由智能驾驶转型为生成式AI,未来将推出更多功能。

🎯

关键要点

  • 图森未来推出开源视频生成模型Ruyi,用户可上传图片生成720P、5秒视频。
  • Ruyi支持多种风格的视频生成,表现良好但存在细节问题。
  • 用户可在Hugging Face和GitHub上下载Ruyi模型,使用简单。
  • Ruyi支持最多5个起始帧和结束帧,提供运动幅度和镜头控制。
  • 图森未来由智能驾驶转型为生成式AI,计划推出更多功能。
  • Ruyi基于DiT架构,使用Casual VAE和Diffusion Transformer模块。
  • 模型参数量约为7.1B,使用约200M个视频片段进行训练。
  • 未来将推出Ruyi Standard闭源模型和ACG-GEN工具,满足专业需求。
➡️

继续阅读