AIxiv专栏促进学术交流,报道超过2000篇内容。新一代Kaldi团队提出CR-CTC算法,提升语音识别性能,并在多个数据集上取得新SOTA结果。该方法通过一致性正则化优化CTC模型,增强模型的泛化能力。
利用Kaldi-NL工具,提出了一种自动化的digits-in-noise(DIN)测试设置,可以在没有人工监督的情况下评估口语反应,并通过评估Kaldi-NL的解码响应来分析其性能和对DIN测试结果的影响,为临床应用提供可行性。
完成下面两步后,将自动完成登录并继续当前操作。