机器之心 ·

智驾公司下场搞AI视频生成，模型上线即开源

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

图森未来推出开源视频生成模型Ruyi，用户可上传图片生成720P、5秒视频，支持多种风格，表现良好但存在细节问题。该公司由智能驾驶转型为生成式AI，未来将推出更多功能。

🎯

🔎

图森未来的Ruyi模型开源，降低了用户的使用门槛，任何人都可以轻松上手。这种开放策略不仅促进了技术的传播，也吸引了更多开发者参与改进。然而，开源也意味着需要面对潜在的安全和版权问题，用户在使用生成内容时需谨慎，确保不侵犯他人权益。

图森未来的转型展示了技术跨界的可能性。公司利用在智能驾驶领域积累的技术优势，迅速进入生成式AI市场。这种转型不仅能带来新的商业机会，也可能推动AI技术的进一步发展。然而，快速转型也伴随着风险，如何保持技术的稳定性和创新性将是未来的挑战。

Ruyi模型的推出为动画和游戏产业带来了新的可能性。通过降低内容开发的周期和成本，Ruyi有望吸引更多创作者使用。然而，模型目前存在细节问题，如手部畸形和面部细节崩坏，这可能影响用户体验。未来的版本升级和功能扩展将是关键，尤其是在满足专业需求方面。

❓

Ruyi模型可以通过上传一张图片生成720P、5秒的视频，支持多种风格。

用户可以在Hugging Face和GitHub上下载Ruyi模型，使用简单。

Ruyi模型的参数量约为7.1B，使用了约200M个视频片段进行训练。

图森未来转型是为了利用在自动驾驶领域的技术积累，探索新的商业化机会。

Ruyi在画面一致性、动作流畅性和真实性上表现良好，但存在细节问题。

未来将推出Ruyi Standard闭源模型和ACG-GEN工具，以满足专业需求。

🏷️