多语言口述历史档案中双语和三语 Wav2Vec 模型的自动语音识别比较分析
原文中文,约400字,阅读约需1分钟。发表于: 。我们将单语言 Wav2Vec2.0 模型与各种多语言模型进行比较,以查看我们是否可以改善对一个包含很多混合语言句子的独特口述历史档案的语音识别性能。我们的主要目标是推动这个独特数据集的研究,它是我们文化遗产的极有价值的一部分。我们的结果表明,大多数情况下,单语言语音识别模型优于多语言模型,甚至在处理来自非母语讲者的充满混合语言句子的口述历史档案时也是如此。我们还在公共的...
本研究比较了单语言Wav2Vec2.0模型和多语言模型在处理混合语言句子的语音识别性能。结果显示单语言模型表现更好,对非母语讲者的口述历史档案也有效。同时,通过验证结果并发布预训练模型,为研究社区做出了贡献。