本研究分析了大型语言模型在处理非洲裔美国英语时的偏见,发现其在准确性和推理复杂性方面表现不佳,尤其在社会科学和人文学科领域。这表明模型在不同语言变体的处理上存在系统性差异。
本研究探讨了非洲裔美国英语(AAE)在自然语言处理中的挑战,比较了不同NLP模型对AAE语法特征的识别能力,指出大型语言模型受到文本偏见的影响,需改进训练和架构。
本研究定量分析了自动语音识别系统和人类转录员在转录过程中的风格差异,特别是在非洲裔美国英语中的表现。研究探讨了逐字特征和AAE形态句法特征的相互作用,揭示了人类转录员对ASR输出的影响,推动了这些语言变体在ASR评估中的理解。
本文验证了一种基于文本可预测性的模型方法,用于衡量文本可预测性对识别器的影响,并得到衡量值$k$。作者证明Wav2Vec 2.0模型比混合ASR模型更好地利用文本上下文,并阐明了标准ASR系统在非洲裔美国英语上表现不佳的原因。作者指出声学-语音模型的失败是主要原因,并展示了如何使用该方法诊断和提高ASR。
完成下面两步后,将自动完成登录并继续当前操作。