转换与发声:最小监督下的零样本口音转换
本研究探讨了无监督文本到语音合成作为数据增强方法,以改进口音语音识别的应用。实验结果显示,使用无监督语音合成生成的带有口音的语音数据进行微调可以显著降低相对字错误率6.1%。
原文中文,约500字,阅读约需1分钟。
本研究探讨了无监督文本到语音合成作为数据增强方法,以改进口音语音识别的应用。实验结果显示,使用无监督语音合成生成的带有口音的语音数据进行微调可以显著降低相对字错误率6.1%。