Modular Blog ·

Modular：由Modular平台驱动的“TTS 1 Max”在人工分析中排名第一的语音模型

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

Inworld与Modular合作成功，'Inworld TTS 1 MAX'模型在语音排行榜中位列第一。该平台测试了超过100种LLM，评估其智能、速度和成本。两款模型支持12种语言，具备语音克隆和情感标签功能，提升了文本转语音的性能与效率。

🎯

🔎

Inworld TTS 1 MAX在人工分析平台上排名第一，显示出其在语音合成领域的竞争力。随着市场上语音模型的增多，用户在选择时应关注模型的智能、速度和成本等多维度表现，以确保选择最适合其需求的产品。

Inworld与Modular的合作显著提升了API的性能，合成音频的返回速度提高了约70%，延迟降低至200毫秒。这种技术整合不仅提升了用户体验，也为企业降低了成本，展示了合作在技术创新中的重要性。

Inworld TTS 1和TTS 1 Max支持12种语言，具备语音克隆和情感标签功能。这使得这些模型在全球市场中具有更广泛的应用潜力，尤其是在多语言环境下的客户服务和数字助手领域。

❓

Inworld TTS 1 MAX模型在人工分析的语音排行榜中位列第一。

Artificial Analysis是一个独立的基准测试平台，测试超过100种LLM的智能、速度和成本。

这两款模型支持12种语言，包括英语、西班牙语、法语、韩语和中文。

Inworld TTS 1的平均生成速度为每秒约153个字符，TTS 1 MAX为每秒约69个字符。

与Modular的合作使得API的合成音频返回速度提高了约70%，延迟降低至200毫秒。

该模型支持语音标签，允许用户添加情感、传递风格和非语言声音，如“低语”、“咳嗽”和“惊讶”。

🏷️