通过多任务学习从转录语音音频中获取发音知识

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究通过多任务学习方法解决了传统文本到语音(TTS)管道中固定词汇覆盖的局限性,实施流程更简单。

🎯

关键要点

  • 本研究通过多任务学习方法解决了传统文本到语音(TTS)管道中固定词汇覆盖的局限性。
  • 研究利用转录的语音音频作为额外的训练来源。
  • 所提MTL方法针对仅在转录语音音频中覆盖的词类型将PER从2.5%降低到1.6%。
  • 该方法实现了与之前方法相似的性能,但实施流程更简单。
➡️

继续阅读