平衡的行动:揭示和缓解葡萄牙语 ASR 偏见
原文中文,约400字,阅读约需1分钟。发表于: 。本研究旨在全面探索 Whisper 和 MMS 系统,重点评估与葡萄牙语的非正式对话语音相关的自动语音识别中存在的偏见。我们的调查包含不同类别,包括性别、年龄、肤色和地理位置。除了传统的 ASR 评估指标(如词错误率 WER)外,我们还引入了 p 值统计显著性来分析性别偏见。此外,我们广泛研究了数据分布的影响,并实证表明过采样技术可以减轻此类刻板化偏见。本研究通过应用 MMS 和...
本研究评估了自动语音识别中与葡萄牙语非正式对话语音相关的偏见,并使用MMS和Whisper系统进行分析。研究发现过采样技术可以减轻偏见,对多语言设置下的ASR系统性能具有重要意义。