ICASSP 2024车载多通道自动语音识别(ICMC-ASR)挑战收集了100多小时的多通道语音数据,并设立了ASR和ASDR两个赛道。USTCiflytek团队在ASR赛道上取得了13.16%的CER,在ASDR赛道上取得了21.48%的cpCER,相比挑战基线,ASR方面改进了13.08%,ASDR方面改进了51.4%。
本研究介绍了我们在2023年中国持续视觉语音识别挑战赛中的系统,使用了中间连接主义时间分类残差模块和双变压器解码器提高准确性。使用汉字作为建模单元,并使用递归神经网络语言模型进行浅层融合。实验结果显示,我们的系统在评估集上的字符错误率为38.09%,相对于基准线减少了21.63%,并获得第二名。
完成下面两步后,将自动完成登录并继续当前操作。