ICASSP2024 ICMC-ASR 大赛的 NUS-HLT 系统

原文约300字,阅读约需1分钟。发表于:

我们团队在 ICMC-ASR 挑战赛的两个方向上付出了努力,包括多通道前端增强和辨析、训练数据增强、多通道分支的语音识别模型,经测试,在官方 Eval1 和 Eval2 数据集上,我们的最佳系统相对于官方基准系统提高了 34.3% 的 CER 和 56.5% 的 cpCER。

本研究介绍了我们在2023年中国持续视觉语音识别挑战赛中的系统,使用了中间连接主义时间分类残差模块和双变压器解码器提高准确性。使用汉字作为建模单元,并使用递归神经网络语言模型进行浅层融合。实验结果显示,我们的系统在评估集上的字符错误率为38.09%,相对于基准线减少了21.63%,并获得第二名。

相关推荐 去reddit讨论