💡
原文英文,约600词,阅读约需3分钟。
📝
内容提要
谷歌DeepMind推出了一款新AI工具,可以根据视频像素和文本提示生成音轨。该工具能够创建与视频场景匹配的音效和对话,生成无限数量的音轨,提升音频与视频的配合。目前该工具仍在测试中,未来将带有AI生成的水印。
🎯
关键要点
-
谷歌DeepMind推出了一款新AI工具,可以根据视频像素和文本提示生成音轨。
-
该工具能够创建与视频场景匹配的音效和对话,生成无限数量的音轨。
-
用户可以使用文本提示生成音频,但文本提示是可选的。
-
DeepMind的工具经过训练,能够将音频事件与视觉场景匹配。
-
该工具仍在测试中,未来将带有AI生成的水印。
❓
延伸问答
谷歌DeepMind的新AI工具有什么功能?
该工具可以根据视频像素和文本提示生成音轨,创建与视频场景匹配的音效和对话。
用户如何使用该AI工具生成音轨?
用户可以选择使用文本提示生成音频,但文本提示是可选的,工具也能自动匹配音频与视频场景。
DeepMind的AI工具与其他音效生成工具有什么不同?
该工具能够生成无限数量的音轨,并且可以自动匹配音频与视频场景,而其他工具如ElevenLabs的工具则主要依赖文本提示。
该工具目前处于什么阶段?
该工具仍在测试中,尚未普遍可用,需要经过严格的安全评估和测试。
DeepMind的AI工具在生成音轨时有哪些限制?
该工具在同步口型与对话方面存在改进空间,并且视频质量差可能导致音频质量下降。
生成的音轨会有标识吗?
是的,生成的音轨将带有Google的SynthID水印,以标识其为AI生成的内容。
➡️