多语言语音模型在自动语音识别中表现出性别性能差距

原文约400字,阅读约需1分钟。发表于:

多任务、多语种模型在语音识别中的广泛应用,虽然适用于多种语言,但仍存在在性别间表现差异的问题。我们通过系统评估多语种 ASR 系统在性别表现差异上的问题,并发现了明显的性别差异。在 19 种语言的三个数据集上,我们使用两种流行的模型,跨越了七个语系。尽管在声调、说话速度等语音学变量方面没有显著差异,并且模型内部状态的分析显示探针性能与性别差异之间存在负相关。也就是说,在一个语言中更容易区分说话者性别时,模型更倾向于女性说话者。我们的研究结果表明,尽管多任务和多语种方面取得了很大进展,但性别间的差异问题仍未解决。我们提供了有价值的首批关于多语种 ASR 系统性别差距评估的见解。我们将所有代码和相关资料发布在此 https URL

多任务、多语种模型在语音识别中存在性别间表现差异问题。研究发现模型更倾向于女性说话者。尽管取得进展,性别间差异问题仍未解决。

相关推荐 去reddit讨论