💡
原文中文,约2800字,阅读约需7分钟。
📝
内容提要
图森未来推出开源视频生成模型Ruyi,用户可上传图片生成720P、5秒视频,支持多种风格,表现良好但存在细节问题。该公司由智能驾驶转型为生成式AI,未来将推出更多功能。
🎯
关键要点
- 图森未来推出开源视频生成模型Ruyi,用户可上传图片生成720P、5秒视频。
- Ruyi支持多种风格的视频生成,表现良好但存在细节问题。
- 用户可在Hugging Face和GitHub上下载Ruyi模型,使用简单。
- Ruyi支持最多5个起始帧和结束帧,提供运动幅度和镜头控制。
- 图森未来由智能驾驶转型为生成式AI,计划推出更多功能。
- Ruyi基于DiT架构,使用Casual VAE和Diffusion Transformer模块。
- 模型参数量约为7.1B,使用约200M个视频片段进行训练。
- 未来将推出Ruyi Standard闭源模型和ACG-GEN工具,满足专业需求。
➡️