云栖发布:从级联到端到端语音翻译大模型Gummy

云栖发布:从级联到端到端语音翻译大模型Gummy

💡 原文中文,约1100字,阅读约需3分钟。
📝

内容提要

通义实验室语音团队和自然语言处理团队联盟在2024年云栖大会上推出了端到端语音翻译大模型Gummy,支持多语言实时翻译,翻译延迟低于0.5秒。Gummy还具备多语言混翻、术语干预与领域提示等商业化能力,解决语言障碍和多语言交流需求。

🎯

关键要点

  • 通义实验室在2024年云栖大会上推出了端到端语音翻译大模型Gummy。
  • Gummy支持多达十余种语言的实时翻译,翻译延迟低于0.5秒。
  • Gummy采用端到端模型,直接将语音翻译为目标语言,无需中间文本。
  • 在多个开源测试集上,Gummy取得了SOTA结果,翻译质量显著优于传统级联系统。
  • Gummy支持多语言混翻、术语干预与领域提示等商业化能力。
  • 实时语音翻译技术在教育、医疗、国际贸易等领域具有重要应用潜力。
  • Gummy部分功能已上线通义APP,用户可下载体验。
➡️

继续阅读