FusDom: 结合领域内外知识进行持续自监督学习

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了一种名为稳定蒸馏的方法,用于持续预训练和提升目标领域自动语音识别(ASR)性能。该方法通过自蒸馏作为正则化方式,减轻了持续预训练中的过拟合问题。实验结果表明,稳定蒸馏在不同实验设置中胜过了所有基线方法,WER 提高了0.8-7个百分点。

🎯

关键要点

  • 提出了一种名为稳定蒸馏的方法,用于提升目标领域自动语音识别(ASR)性能。

  • 稳定蒸馏通过自蒸馏作为正则化方式,减轻了持续预训练中的过拟合问题。

  • 该方法在有限的有标签和无标签数据下进行基于自监督预训练(SSL)的持续适应。

  • 实验结果表明,稳定蒸馏在不同实验设置中胜过所有基线方法,WER 提高了0.8-7个百分点。

➡️

继续阅读