极道 ·

Gemini Omni视频模型发布：好像比Seedance2还差点！

💡 原文中文，约4600字，阅读约需11分钟。

📝

内容提要

谷歌发布了Gemini Omni视频生成模型，能够理解物理规律，用户可通过自然语言指令编辑视频。与传统AI工具不同，Gemini Omni支持多种素材融合，生成和谐视频。尽管功能强大，但在画质和流畅度上被竞争对手Seedance 2.0超越。

🎯

🔎

Gemini Omni在视频生成领域引入了自然语言指令和物理理解的创新，使得视频编辑变得更加直观。然而，尽管其多模态融合能力强大，但在画质和流畅度上仍不及Seedance 2.0，这表明在追求技术创新的同时，基础画质的稳定性仍需加强。

Seedance 2.0在画质和动态流畅度方面表现优异，能够生成更具电影感的画面。相比之下，Gemini Omni虽然具备理解物理的能力，但在实际应用中，用户更看重的是视觉效果和稳定性，这使得Seedance在市场竞争中占据优势。

谷歌的Gemini Omni致力于成为一个理解世界运转规律的模型，虽然目前在画质上落后于Seedance，但其长远目标是实现更高层次的创作自由。未来，若能在画质和流畅度上取得突破，可能会吸引更多专业用户的关注。

❓

Gemini Omni能够理解物理规律，通过自然语言指令编辑视频，支持多种素材融合生成和谐视频。

Gemini Omni允许用户像聊天一样与AI互动，支持对话式编辑，而传统工具通常需要复杂的提示词。

它使得生成的视频能够更真实地反映物体运动的物理逻辑，避免了老式AI生成不自然场景的问题。

在画质和流畅度上，Gemini Omni被Seedance 2.0超越，存在画面一致性和镜头语言处理不足的问题。

用户可以直接输入修改指令，AI只会调整指定部分，避免了重新生成整个视频的麻烦。

谷歌表示正在研究如何负责任地推出该功能，以防止其被用于诈骗等不当用途。

🏷️