小红花·文摘

本研究探讨了循环神经网络传输器（RNN-T）和不同架构的端到端语音识别模型。通过字元素和未配对数据训练，显著降低了单词错误率。新型流式多说话人识别框架和CIF-Transducer模型在多个数据集上表现出色，提升了计算效率和准确性。