代码混合语音的自动矩阵语言确定方法
原文中文,约300字,阅读约需1分钟。发表于: 。该研究解决了代码切换(CS)语音中矩阵语言身份(MLID)识别的问题,通过矩阵语言框架(MLF)理论开发了相关系统。研究发现,音频中的MLID预测与文本原则的相关性高于通常的语言识别(LID),并且在MLID识别任务中表现优于LID,显示出非英语语言在混合语法结构中更受偏好。
本文介绍了通过拼接音频片段合成Code-Switching数据的Speech Collage方法,并通过重叠提高音频平滑度。研究显示,这种数据在语音识别中有效,混合错误率和词错误率分别降低34.4%和16.2%。此外,Code-Switching减少了单语偏见。