机器之心 ·

真·赛博菩萨！最大的开源视频模型来了，我们实测：有点东西，但不多

Q: Mochi 1的分辨率限制是什么？

Mochi 1仅支持480p的分辨率。

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

AI视频生成公司Genmo推出了开源模型Mochi 1，具备高保真运动和强提示遵循能力。尽管表现优异，但存在分辨率限制和运动细节不足的问题。Mochi 1基于非对称扩散变换器架构，拥有100亿参数，用户可在Hugging Face平台获取。

🎯

关键要点

Genmo推出了开源视频生成模型Mochi 1，具备高保真运动和强提示遵循能力。
Mochi 1在运动质量、提示遵循性和人类渲染方面表现出色，能够与领先的闭源竞争者打平。
用户可以在Hugging Face平台上获取Mochi 1，但需要至少4块Nvidia H100 GPU才能运行。
Mochi 1存在分辨率限制（仅支持480p）和运动细节不足的问题。
Genmo计划在今年晚些时候推出Mochi 1 HD版本，支持720p分辨率并提高运动细节的精确度。
Mochi 1基于非对称扩散变换器架构，拥有100亿个参数，是目前最大的开源视频生成模型。
Mochi 1采用视频变分自编码器技术，降低了终端用户的设备内存需求。
AI行业近期更新频繁，除了Genmo，Runway和Stability AI等公司也推出了新功能和模型。

🔎

延伸解读

Mochi 1的技术架构

Mochi 1基于非对称扩散变换器架构，拥有100亿个参数，成为目前最大的开源视频生成模型。这种架构专注于视觉推理，处理视频数据的参数量是处理文本数据的四倍，显示出其在视频生成领域的强大潜力。

使用Mochi 1的硬件要求

尽管Mochi 1提供了强大的视频生成能力，但用户在运行该模型时需要至少4块Nvidia H100 GPU。这一硬件要求可能限制了普通用户的使用，尤其是那些没有高性能计算资源的开发者。

Mochi 1的局限性

Mochi 1在分辨率和运动细节方面存在不足，目前仅支持480p分辨率，并且在处理复杂运动时可能出现视觉扭曲。这些局限性在实际应用中可能影响用户体验，尤其是在需要高质量视频输出的场景中。

未来发展方向

Genmo计划在今年晚些时候推出Mochi 1 HD版本，支持720p分辨率并提高运动细节的精确度。这一更新将有助于提升Mochi 1的市场竞争力，吸引更多用户关注和使用该模型。

❓

延伸问答

Mochi 1模型的主要特点是什么？

Mochi 1具备高保真运动和强提示遵循能力，能够精确控制生成视频中的角色和动作。

Mochi 1的分辨率限制是什么？

Mochi 1仅支持480p的分辨率。

如何获取Mochi 1模型？

用户可以在Hugging Face平台上免费获取Mochi 1的完整模型权重和代码。

Mochi 1的运行要求是什么？

要在设备上运行Mochi 1，至少需要配备4块Nvidia H100 GPU。

Genmo计划何时推出Mochi 1的HD版本？

Genmo计划在今年晚些时候推出Mochi 1 HD版本，支持720p分辨率。

Mochi 1与其他视频生成模型相比如何？

Mochi 1在运动质量和提示遵循性方面表现出色，能够与领先的闭源竞争者打平。

🏷️