Vercel News ·

AI Gateway上的Grok Imagine Video 1.5

💡 原文英文，约300词，阅读约需1分钟。

📝

内容提要

xAI发布了Grok Imagine Video 1.5模型，该模型能够根据输入图像生成同步音频的视频。新版本提升了音频质量、提示跟随、照片真实感、面部准确性和角色一致性。用户可通过AI SDK使用此模型，结合图像模型生成动画，AI Gateway提供统一API以便调用和管理。

🎯

🔎

Grok Imagine Video 1.5在音频质量和视频生成方面有显著提升，尤其是在面部准确性和角色一致性上。这意味着用户在制作动画时，可以获得更真实的表现，适合需要高质量视觉内容的项目，如广告和短片制作。

通过AI SDK，用户可以轻松将图像与视频生成模型结合，创造出动态内容。这种灵活性使得开发者能够在创意项目中实现更高的效率，尤其是在游戏开发和虚拟现实应用中，能够快速迭代和测试不同的视觉效果。

AI Gateway提供统一的API，方便用户管理模型调用和使用情况。这种集中管理不仅提高了操作的便捷性，还能有效控制成本，特别适合需要频繁调用AI模型的企业，帮助他们优化资源配置。

❓

Grok Imagine Video 1.5模型能够根据输入图像生成同步音频的视频。

新版本提升了音频质量、提示跟随、照片真实感、面部准确性和角色一致性。

用户需将模型设置为xai/grok-imagine-video-1.5-preview，并结合图像模型生成动画。

AI Gateway提供统一API、使用情况跟踪、成本管理、性能优化等功能。

该模型扩展了参考图像支持，提供更多视觉风格和主题控制。

首先生成图像，然后将图像数据传入Grok Imagine Video 1.5生成视频。

🏷️