💡
原文中文,约2300字,阅读约需6分钟。
📝
内容提要
AI视频生成公司Genmo推出了开源模型Mochi 1,具备高保真运动和强提示遵循能力。尽管表现优异,但存在分辨率限制和运动细节不足的问题。Mochi 1基于非对称扩散变换器架构,拥有100亿参数,用户可在Hugging Face平台获取。
🎯
关键要点
- Genmo推出了开源视频生成模型Mochi 1,具备高保真运动和强提示遵循能力。
- Mochi 1在运动质量、提示遵循性和人类渲染方面表现出色,能够与领先的闭源竞争者打平。
- 用户可以在Hugging Face平台上获取Mochi 1,但需要至少4块Nvidia H100 GPU才能运行。
- Mochi 1存在分辨率限制(仅支持480p)和运动细节不足的问题。
- Genmo计划在今年晚些时候推出Mochi 1 HD版本,支持720p分辨率并提高运动细节的精确度。
- Mochi 1基于非对称扩散变换器架构,拥有100亿个参数,是目前最大的开源视频生成模型。
- Mochi 1采用视频变分自编码器技术,降低了终端用户的设备内存需求。
- AI行业近期更新频繁,除了Genmo,Runway和Stability AI等公司也推出了新功能和模型。
➡️