小红花·文摘

本研究提出了一个来自TalkBank的多语言对话数据集，解决了现有自动语音识别（ASR）基准未能反映现实对话环境复杂性的问题。研究发现在此对话环境下，主流ASR模型性能显著下降，并揭示了语音不流畅性与词错误率之间的相关性，强调了建立更真实对话基准的必要性。