The Verge ·

谷歌DeepMind的新AI工具利用视频像素和文本提示生成音轨

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

谷歌DeepMind推出了一款新AI工具，可以根据视频像素和文本提示生成音轨。该工具能够创建与视频场景匹配的音效和对话，生成无限数量的音轨，提升音频与视频的配合。目前该工具仍在测试中，未来将带有AI生成的水印。

🎯

关键要点

谷歌DeepMind推出了一款新AI工具，可以根据视频像素和文本提示生成音轨。
该工具能够创建与视频场景匹配的音效和对话，生成无限数量的音轨。
用户可以使用文本提示生成音频，但文本提示是可选的。
DeepMind的工具经过训练，能够将音频事件与视觉场景匹配。
该工具仍在测试中，未来将带有AI生成的水印。

❓

延伸问答

谷歌DeepMind的新AI工具有什么功能？

该工具可以根据视频像素和文本提示生成音轨，创建与视频场景匹配的音效和对话。

用户如何使用该AI工具生成音轨？

用户可以选择使用文本提示生成音频，但文本提示是可选的，工具也能自动匹配音频与视频场景。

DeepMind的AI工具与其他音效生成工具有什么不同？

该工具能够生成无限数量的音轨，并且可以自动匹配音频与视频场景，而其他工具如ElevenLabs的工具则主要依赖文本提示。

该工具目前处于什么阶段？

该工具仍在测试中，尚未普遍可用，需要经过严格的安全评估和测试。

DeepMind的AI工具在生成音轨时有哪些限制？

该工具在同步口型与对话方面存在改进空间，并且视频质量差可能导致音频质量下降。

生成的音轨会有标识吗？

是的，生成的音轨将带有Google的SynthID水印，以标识其为AI生成的内容。

🏷️

标签

AI工具 DeepMind ai 视频内容谷歌音效音轨生成

➡️

继续阅读

远程控制安卓工具 Scrcpy 4.1 发布，新增 VP8 / VP9 视频编码支持，让更多安卓设备可以投屏
著名的开源电脑控制安卓工具 Scrcpy 4.1 已经发布，新增支持 VP8 / VP9 视频编码，可以让不支持 H.264、H.265 或 AV1 编码...
有传言称谷歌正在研发名为Frozen v2的芯片将AI模型部分蚀刻到芯片上提高吞吐量
#人工智能谷歌也尝试将模型权重直接蚀刻到硅晶片中，谷歌正在研发的 Frozen v2 芯片 token 吞吐量是谷歌现有 TPU 单元的 6~10 倍。...
AI 成本战的隐性成本与降本五层：从"成功率悖论"到"系统复杂度"（中） - 张善友
今天很多 AI 降本，表面上看是在压 token，本质上是在压复杂度
10 Newsletters Keeping You Ahead in AI
Cut through AI noise with 10 curated newsletters covering daily news, technic...
Meta made its own AI detection system. It should have just used Google’s
IIn March, Meta's Oversight Board called on the company to "meet its ...
Utility companies promise to spare us from AI’s energy bill
In the face of backlash to concerns the AI boom will increase consumer electr...