The Keyword ·

介绍Gemini Omni

💡 原文英文，约1400词，阅读约需5分钟。

📝

内容提要

Nano Banana推出了Gemini Omni，结合图像生成与编辑能力，用户可通过自然语言编辑视频，生成高质量内容。Omni支持图像、音频和文本输入，能够创建真实感强的场景，并具备物理推理能力。首个模型Gemini Omni Flash已上线，未来将扩展更多功能。

🎯

🔎

Gemini Omni支持图像、音频和文本等多种输入方式，使用户能够通过自然语言轻松编辑视频。这种多模态输入的设计不仅提高了创作的灵活性，还能帮助用户更好地表达复杂的创意和想法。

Omni具备物理推理能力，能够生成更真实的场景。这意味着用户在创作时可以更准确地模拟物理现象，如重力和动能，从而提升视频的真实感和观赏性。

用户可以使用自己的数字化身生成视频，这不仅增强了内容的个性化，还确保了生成内容的透明性。每个视频都带有不可见的数字水印，便于用户验证内容的来源和真实性。

❓

Gemini Omni结合图像生成与编辑能力，支持图像、音频和文本输入，能够生成高质量视频并通过自然语言进行编辑。

用户可以通过自然语言指令逐步编辑视频，修改场景、角色和动作，确保内容的一致性和物理合理性。

Gemini Omni Flash是Omni系列的首个模型，已上线并可通过Gemini应用、Google Flow和YouTube Shorts使用。

所有使用Omni生成的视频都包含不可见的SynthID数字水印，用户可以通过Gemini应用和Google搜索验证内容的生成来源。

Omni具备改进的物理推理能力，能够更准确地理解重力、动能和流体动力学，从而创建更真实的场景。

用户可以使用Avatars功能创建自己的数字化身，以生成看起来和听起来像自己的视频。

🏷️