谷歌DeepMind的新AI工具利用视频像素和文本提示生成音轨

谷歌DeepMind的新AI工具利用视频像素和文本提示生成音轨

💡 原文英文,约600词,阅读约需3分钟。
📝

内容提要

谷歌DeepMind推出了一款新AI工具,可以根据视频像素和文本提示生成音轨。该工具能够创建与视频场景匹配的音效和对话,生成无限数量的音轨,提升音频与视频的配合。目前该工具仍在测试中,未来将带有AI生成的水印。

🎯

关键要点

  • 谷歌DeepMind推出了一款新AI工具,可以根据视频像素和文本提示生成音轨。

  • 该工具能够创建与视频场景匹配的音效和对话,生成无限数量的音轨。

  • 用户可以使用文本提示生成音频,但文本提示是可选的。

  • DeepMind的工具经过训练,能够将音频事件与视觉场景匹配。

  • 该工具仍在测试中,未来将带有AI生成的水印。

延伸问答

谷歌DeepMind的新AI工具有什么功能?

该工具可以根据视频像素和文本提示生成音轨,创建与视频场景匹配的音效和对话。

用户如何使用该AI工具生成音轨?

用户可以选择使用文本提示生成音频,但文本提示是可选的,工具也能自动匹配音频与视频场景。

DeepMind的AI工具与其他音效生成工具有什么不同?

该工具能够生成无限数量的音轨,并且可以自动匹配音频与视频场景,而其他工具如ElevenLabs的工具则主要依赖文本提示。

该工具目前处于什么阶段?

该工具仍在测试中,尚未普遍可用,需要经过严格的安全评估和测试。

DeepMind的AI工具在生成音轨时有哪些限制?

该工具在同步口型与对话方面存在改进空间,并且视频质量差可能导致音频质量下降。

生成的音轨会有标识吗?

是的,生成的音轨将带有Google的SynthID水印,以标识其为AI生成的内容。

➡️

继续阅读