聚焦判别训练用于流式CTC训练的自动语音识别模型

📝

内容提要

本文介绍了一种名为聚焦判别训练(FDT)的新训练框架,旨在改善流式端到端自动语音识别模型在识别挑战性音频片段方面的表现。该框架独立于隐马尔可夫模型和格,减少了在标准判别训练中需进行的复杂决策,同时在LibriSpeech上实现了更大幅度的字错误率降低。

➡️

继续阅读