💡
原文英文,约300词,阅读约需1分钟。
📝
内容提要
xAI发布了Grok Imagine Video 1.5模型,该模型能够根据输入图像生成同步音频的视频。新版本提升了音频质量、提示跟随、照片真实感、面部准确性和角色一致性。用户可通过AI SDK使用此模型,结合图像模型生成动画,AI Gateway提供统一API以便调用和管理。
🎯
关键要点
- xAI发布了Grok Imagine Video 1.5模型,该模型能够根据输入图像生成同步音频的视频。
- 新版本提升了音频质量、提示跟随、照片真实感、面部准确性和角色一致性。
- 用户可通过AI SDK使用此模型,结合图像模型生成动画。
- AI Gateway提供统一API以便调用和管理,支持使用情况跟踪和成本管理。
❓
延伸问答
Grok Imagine Video 1.5模型的主要功能是什么?
Grok Imagine Video 1.5模型能够根据输入图像生成同步音频的视频。
Grok Imagine Video 1.5相比于之前版本有哪些改进?
新版本提升了音频质量、提示跟随、照片真实感、面部准确性和角色一致性。
如何在AI SDK中使用Grok Imagine Video 1.5模型?
用户需将模型设置为xai/grok-imagine-video-1.5-preview,并结合图像模型生成动画。
AI Gateway提供了哪些功能?
AI Gateway提供统一API、使用情况跟踪、成本管理、性能优化等功能。
Grok Imagine Video 1.5支持哪些图像样式控制?
该模型扩展了参考图像支持,提供更多视觉风格和主题控制。
使用Grok Imagine Video 1.5生成视频的基本步骤是什么?
首先生成图像,然后将图像数据传入Grok Imagine Video 1.5生成视频。
➡️