小红花·文摘 - 小红花技术领袖俱乐部

音调重音检测提升了预训练自动语音识别的性能

音调重音检测提升了预训练自动语音识别的性能

Apple Machine Learning Research ·

本文研究了多种文本到语音（TTS）模型的改进方法，包括引入BERT模型以提高语音合成质量，采用多语言合成技术实现跨语言语音转移，以及利用无监督学习增强口音识别。实验结果表明，这些方法在低资源环境下有效提升了语音合成的自然度和准确性。

跨方言语音合成中的音调重音语言结合多方言音素级BERT

BriefGPT - AI 论文速递 ·

该研究探讨了自动语音识别（ASR）系统在不同口音上的普适性，提出了无监督学习、微调技术和声学知识等方法以提高识别准确性和鲁棒性。研究表明，合成口音数据和个性化模型训练能显著提升对非标准语音的识别效果，尤其在不同口音情境下表现优异。

聚类和挖掘重音语音以实现包容和公正的语音识别

BriefGPT - AI 论文速递 ·

本文提出了一种可扩展的文本转语音方法，通过预测强调词的持续时间来改善自然度，测试表明该方法可以提高强调单词的识别率。

使用自注意力模型检测音节级发音重音

BriefGPT - AI 论文速递 ·

10分钟意大利语教程

10分钟意大利语教程

王建硕的博客 ·