💡 原文中文,约800字,阅读约需2分钟。
📝

内容提要

Hume AI 正在测试支持 10 种以上语言的低延迟文本转语音模型 Octave 2 Multilingual,该模型适用于实时翻译和对话界面,能够自然切换语言并生成更接近人类的语音,预计将受到商业和研究领域的关注。

🎯

关键要点

  • Hume AI 正在测试 Octave 2 Multilingual,这是一个支持 10 种以上语言的低延迟文本转语音模型。
  • Octave 2 Multilingual 适用于实时翻译、语音机器人和对话界面,能够自然切换语言并生成接近人类的语音。
  • 新模型的目标用户包括开发多语言应用程序的开发者和制作多语言播客的创作者。
  • Octave 2 在音频生成方面比前代产品更自然,难以与真人说话者区分。
  • 该模型尚未公开发布,但已在内部测试中显示出良好的性能,预计将吸引商业和研究领域的关注。
  • Hume AI 的产品方向专注于情感丰富且具备情境感知能力的 AI 语音。
  • 开发人员和早期采用者应关注即将发布的更新和公开演示。
➡️

继续阅读