💡 原文英文,约400词,阅读约需2分钟。
📝

内容提要

Inworld与Modular合作成功,'Inworld TTS 1 MAX'模型在语音排行榜中位列第一。该平台测试了超过100种LLM,评估其智能、速度和成本。两款模型支持12种语言,具备语音克隆和情感标签功能,提升了文本转语音的性能与效率。

🎯

关键要点

  • Inworld与Modular合作成功,'Inworld TTS 1 MAX'模型在语音排行榜中位列第一。
  • Artificial Analysis是一个独立的基准测试平台,测试超过100种LLM的智能、速度和成本。
  • 语音排行榜基于用户的偏好,比较生成的语音并选择更喜欢的输出。
  • Inworld TTS 1 Max和Inworld TTS 1支持12种语言,具备语音克隆和情感标签功能。
  • Inworld TTS 1的平均生成速度为每秒约153个字符,Inworld TTS 1 Max为每秒约69个字符。
  • 两款模型均基于变换器的自回归模型,使用LLaMA-3.2-1B和LLaMA-3.1-8B作为其SpeechLM基础。
  • 与Modular的合作使得API的合成音频返回速度提高了约70%,延迟降低至200毫秒。
  • 通过使用Modular的技术栈,API的价格降低了约60%。
➡️

继续阅读