蓝点网 ·

谷歌发布Gemini 3.5实时语音翻译模型已在安卓和iOS版谷歌翻译中上线也提供API

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

谷歌发布了Gemini 3.5实时语音翻译模型，支持70多种语言，具备抗噪能力，已在谷歌翻译iOS和安卓版上线。该模型能够生成自然流畅的翻译语音，保持说话者的语调和语速，适用于多语言会议和视频通话。开发者可通过Gemini Live API构建语音翻译应用，提升用户体验。

🎯

🔎

Gemini 3.5实时语音翻译模型的推出，极大地提升了多语言会议的沟通效率。其抗噪能力和自然流畅的翻译语音，使得参与者能够更专注于讨论内容，而不是语言障碍。这对于国际企业和跨国合作尤为重要，能够促进更顺畅的交流与合作。

通过Gemini Live API，开发者可以构建多种语音翻译应用，提升用户体验。然而，开发者需注意模型的集成复杂性和实时处理的技术要求，确保在不同环境下都能稳定运行。此外，如何优化用户界面以适应不同语言用户的需求也是一大挑战。

Gemini 3.5模型在翻译过程中保留说话者的语调和语速，提供更自然的交流体验。用户在使用谷歌翻译时，需佩戴耳机以避免干扰，这一点在嘈杂环境中尤为重要。未来，随着技术的不断进步，用户体验有望进一步提升，尤其是在实时翻译的准确性和流畅性方面。

❓

Gemini 3.5实时语音翻译模型支持超过70种语言。

该模型具备强大的抗噪能力，能够应对嘈杂和多变的环境。

用户需要佩戴耳机以避免干扰，并可以通过谷歌翻译应用直接使用该功能。

该模型可以为多语言会议提供实时口译服务，提升整体翻译体验。

开发者可以通过Gemini Live API构建和部署语音翻译应用，提升用户体验。

该模型能够生成自然流畅的翻译语音，保留说话者的语调和语速。

🏷️