The Keyword ·

Gemini 3.1 Flash TTS：下一代富有表现力的人工智能语音

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

谷歌推出了Gemini 3.1 Flash TTS，这是最新的文本转语音模型，具备更好的可控性、表现力和音质，支持70多种语言，并提供音频标签以控制语音风格和节奏。所有生成的音频都带有不可见水印SynthID，以防止虚假信息传播。

🎯

🔎

Gemini 3.1 Flash TTS引入的音频标签功能，允许用户通过自然语言命令控制语音的风格和节奏。这一创新使得开发者能够更精确地调整语音输出，提升了文本转语音的表现力，适用于多种场景，如游戏角色对话或教育应用。

所有生成的音频都带有不可见水印SynthID，这一设计旨在防止虚假信息的传播。随着AI生成内容的普及，确保内容的真实性变得尤为重要，SynthID的应用为用户提供了一种识别和验证AI生成内容的有效手段。

Gemini 3.1 Flash TTS支持70多种语言，具备高保真语音生成能力。这使得开发者能够为全球用户创造本地化的语音体验，尤其在多语言市场中，能够满足不同文化和语言背景用户的需求，具有广泛的应用前景。

❓

Gemini 3.1 Flash TTS具备更好的可控性、表现力和音质，支持70多种语言，并引入音频标签以控制语音风格和节奏。

用户可以通过将自然语言命令嵌入文本输入中，使用音频标签来控制语音输出的风格、节奏和表达。

该模型在人工分析TTS排行榜上获得了1211的Elo分数，显示出其高质量的语音生成能力。

所有生成的音频都带有不可见水印SynthID，以帮助检测AI生成的内容，防止虚假信息传播。

该模型适合开发者、企业和普通用户，帮助他们构建下一代AI语音应用。

Gemini 3.1 Flash TTS支持70多种语言，能够为全球用户提供本地化的表达体验。

🏷️