The Keyword ·

Gemini 3.1 Flash Live：让音频人工智能更加自然和可靠

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

谷歌推出Gemini 3.1 Flash Live，增强语音对话能力，支持开发者和企业构建复杂任务的语音代理。该模型在自然对话和多语言支持方面表现出色，能够更好地理解用户情绪，提供快速自然的响应。

🎯

🔎

Gemini 3.1 Flash Live的多语言能力使其在全球范围内的应用潜力大幅提升。用户可以在超过200个国家和地区使用该模型进行实时对话，这为跨国企业和多文化团队提供了便利，促进了更广泛的沟通与合作。

该模型在嘈杂环境中处理复杂任务的能力显著增强，这对于需要在嘈杂场所进行语音交互的应用场景尤为重要。企业可以利用这一优势，提升客户服务质量，确保用户在各种环境下都能获得流畅的对话体验。

Gemini 3.1 Flash Live在理解用户情绪方面的改进，使其能够更好地响应用户的挫折或困惑。这一特性不仅提升了用户体验，也为开发者提供了构建更具人性化的语音代理的基础，增强了与用户的互动效果。

❓

Gemini 3.1 Flash Live增强了语音对话能力，支持开发者和企业构建复杂任务的语音代理。

该模型支持多语言，能够在全球超过200个国家和地区进行实时对话。

在复杂任务执行方面，Gemini 3.1 Flash Live的评分达到90.8%，能够在嘈杂环境中有效处理多步骤功能调用。

该模型提供更自然的对话，能够更好地理解用户情绪，并快速响应用户的需求。

所有生成的音频都带有不可察觉的水印，以防止错误信息传播。

Verizon、LiveKit和The Home Depot等公司对Gemini 3.1 Flash Live在工作流程中的表现给予了积极反馈。

🏷️