本研究指出现有的自动语音识别(ASR)基准未能真实反映对话环境的复杂性,并提出了来自TalkBank的多语言对话数据集。研究表明,主流ASR模型在此环境下性能显著下降,强调建立更真实对话基准的必要性。
完成下面两步后,将自动完成登录并继续当前操作。