Google DeepMind Blog ·

Gemini 3.1 Flash Live：让音频人工智能更加自然和可靠

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

谷歌推出了Gemini 3.1 Flash Live，这是其最高质量的音频模型，旨在提供更自然、可靠的实时对话。该模型支持开发者通过Gemini Live API使用，企业可用于客户体验，用户可通过Search Live和Gemini Live体验。3.1 Flash Live在理解语调和处理复杂任务方面表现出色，能够在嘈杂环境中提供更自然的对话，所有生成的音频都带有水印，以防止虚假信息传播。

🎯

关键要点

谷歌推出了Gemini 3.1 Flash Live，这是其最高质量的音频模型，旨在提供更自然、可靠的实时对话。
开发者可以通过Gemini Live API访问该模型，企业可用于客户体验，用户可通过Search Live和Gemini Live体验。
3.1 Flash Live在理解语调和处理复杂任务方面表现出色，能够在嘈杂环境中提供更自然的对话。
所有生成的音频都带有水印，以防止虚假信息传播。
该模型在多项基准测试中表现优异，能够更好地处理复杂指令和长时间的对话。
Gemini Live和Search Live现在支持超过200个国家的实时多模态对话，提供更快速和自然的响应。

🔎

延伸解读

音频模型的应用场景

Gemini 3.1 Flash Live不仅适用于开发者和企业，还能为普通用户提供更自然的对话体验。企业可以利用该模型改善客户服务，提升用户满意度，而开发者则可以构建更复杂的语音助手，满足多样化的需求。

水印技术的重要性

所有由Gemini 3.1 Flash Live生成的音频都带有水印，这一措施旨在防止虚假信息的传播。随着AI生成内容的普及，确保信息来源的可靠性变得尤为重要，用户在使用时应关注音频的水印标识。

多语言支持的优势

Gemini 3.1 Flash Live的多语言能力使其在全球范围内的应用更加广泛，支持超过200个国家的实时对话。这一特性不仅提升了用户体验，也为企业的国际化发展提供了便利，值得关注。

❓

延伸问答

Gemini 3.1 Flash Live的主要功能是什么？

Gemini 3.1 Flash Live旨在提供更自然、可靠的实时对话，支持开发者和企业使用。

开发者如何使用Gemini 3.1 Flash Live？

开发者可以通过Gemini Live API在Google AI Studio中访问Gemini 3.1 Flash Live。

Gemini 3.1 Flash Live在嘈杂环境中的表现如何？

该模型能够在嘈杂环境中提供更自然的对话，表现出色。

Gemini 3.1 Flash Live如何防止虚假信息传播？

所有生成的音频都带有水印，以帮助检测AI生成的内容，防止虚假信息传播。

Gemini 3.1 Flash Live的多语言支持情况如何？

该模型支持超过200个国家的实时多模态对话，具备多语言能力。

Gemini 3.1 Flash Live在基准测试中的表现如何？

在多项基准测试中，Gemini 3.1 Flash Live表现优异，特别是在复杂指令和长时间对话的处理上。

🏷️