💡
原文中文,约1100字,阅读约需3分钟。
📝
内容提要
通义实验室语音团队和自然语言处理团队联盟在2024年云栖大会上推出了端到端语音翻译大模型Gummy,支持多语言实时翻译,翻译延迟低于0.5秒。Gummy还具备多语言混翻、术语干预与领域提示等商业化能力,解决语言障碍和多语言交流需求。
🎯
关键要点
- 通义实验室在2024年云栖大会上推出了端到端语音翻译大模型Gummy。
- Gummy支持多达十余种语言的实时翻译,翻译延迟低于0.5秒。
- Gummy采用端到端模型,直接将语音翻译为目标语言,无需中间文本。
- 在多个开源测试集上,Gummy取得了SOTA结果,翻译质量显著优于传统级联系统。
- Gummy支持多语言混翻、术语干预与领域提示等商业化能力。
- 实时语音翻译技术在教育、医疗、国际贸易等领域具有重要应用潜力。
- Gummy部分功能已上线通义APP,用户可下载体验。
➡️