本研究探讨了循环神经网络传输器(RNN-T)和不同架构的端到端语音识别模型。通过字元素和未配对数据训练,显著降低了单词错误率。新型流式多说话人识别框架和CIF-Transducer模型在多个数据集上表现出色,提升了计算效率和准确性。
完成下面两步后,将自动完成登录并继续当前操作。