BriefGPT - AI 论文速递 ·

基于令牌加权的 RNN-T 模型用于学习有缺陷的数据

💡 原文中文，约1300字，阅读约需4分钟。

📝

内容提要

本文介绍了一种通过未标记语音数据对递归神经网络转录器进行无监督微调的新方法，显著提升了自动语音识别系统的性能。同时，研究探讨了训练注意力机制模型、半监督学习和文本表示框架等方法，均有效提高了识别准确率。

🎯

❓

通过对递归神经网络转录器进行无监督微调，结合多重假设 RNN-T 损失，可以显著提升系统性能。

“替代伪标签”框架通过伪标签技术的半监督学习，旨在应对噪声伪标签带来的问题。

该模型通过直接最小化单词错误率，效果优于基于模型的采样方法，性能提高了8.2%。

通过基于上下文偏差和似然比的方法，可以提高识别正确率约10%。

SCST 方法通过基于损失函数和词错误率的奖励函数，显著改善了自动语音识别中的词错误率。

该框架显著提高了端到端自动语音识别模型的准确性，并适用于不同的数据集。

🏷️