自动发音评估的新型损失函数:保留音素区分的序数回归

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文研究了基于对比预测编码的自监督学习方法在音素分类和音素、单词分割方面的性能。通过整合多级建模方法到改进版本的CPC中,提高了在所有分类指标上的性能,并在单词分割方面取得了最先进的性能。

🎯

关键要点

  • 本文研究了基于对比预测编码 (CPC) 的自监督学习 (SSL) 方法。

  • 研究重点在音素分类和音素、单词分割方面的性能。

  • 现有算法在分类和分割性能上存在平衡。

  • 为弥合这种差距,借鉴了在分割方面较好的方法。

  • 将多级建模方法整合到 CPC 的改进版本 Aligned CPC (ACPC) 中。

  • 提高了在所有分类指标上的性能。

  • 在单词分割方面取得了最先进的性能。

➡️

继续阅读