2023 年暴雪挑战赛的 IMS Toucan 系统
原文中文,约300字,阅读约需1分钟。发表于: 。改进法语文本至音素处理系统,包括同音异形解歧,使用 Conformer 和 Glow 基于规则的音素转谱图,再通过基于 GAN 的神经声码器将谱图转换为最终音波,应用于 Blizzard Challenge 2023。
该报告介绍了基于Transformer的多语言模型VolcTrans系统,使用多个来源的数据进行训练,包括公共训练集、Meta AI提供的数据、自收集的平行语料库和反向翻译的伪双语文本。该系统在官方测试集上实现了17.3 BLEU、21.9 spBLEU和41.9 chrF2++,平均每秒处理11.5句话,使用单个Nvidia Tesla V100 GPU。