小红花·文摘

本研究解决了低资源语言在自动语音识别（ASR）中可靠性不足的问题。论文提出了一种新颖的多语言口语理解基准Fleurs-SLU，涵盖102种语言的主题语音分类和92种语言的听力理解选择题回答。研究发现级联系统在多语言SLU任务中表现出更强的鲁棒性，并强调了语音与语义表示之间的相互促进效果。

Fleurs-SLU：一个大规模多语言口语理解基准

BriefGPT - AI 论文速递 ·

本研究提出了一种对话上下文感知的语音识别模型，利用上下文信息提升系统性能。实验结果表明，该模型在自动语音识别（ASR）和语音语言理解（SLU）任务中显著提高了语音识别的质量和鲁棒性。

通过噪声表示学习增强对话语音识别的鲁棒上下文感知

BriefGPT - AI 论文速递 ·

本研究介绍了多个多语言数据集，包括MASSIVE、MaSS、MLS和SpeechMatrix，涵盖意图检测、语音识别和翻译等任务。这些数据集为自然语言处理和多语言系统的发展提供了重要资源，推动了相关技术的进步。

语音 - MASSIVE：一个面向 SLU 及更多领域的多语种语音数据集

BriefGPT - AI 论文速递 ·

本文探讨了在微控制器嵌入式设备上的口语理解（SLU）技术，将设备上的执行与云端卸载结合。通过利用时间局部性，设备将新输入与缓存结果进行匹配，并将匹配不成功的输入卸载到云端进行完整的推断。作者提出了一种适用于微型设备的语音缓存XYZ，通过聚类的原始声音单元序列和音素序列两个级别来匹配语音输入。实验结果表明，该系统能够在设备上解决45%至90%的输入，平均延迟降低了80%。

利用缓存在小型设备上实现 SLU

BriefGPT - AI 论文速递 ·

本文介绍了一种名为CLKD的方法，使用英文AS2模型进行跨语言知识蒸馏，可用于训练低资源语言的AS2模型。CLKD方法在不用标注数据的情况下，可与使用相同数量标注数据的监督微调方法相媲美，具有潜力为低资源语言提供更强大的AS2模型。

I$^2$KD-SLU：一种用于零样本跨语言口语语言理解的内外知识蒸馏框架

BriefGPT - AI 论文速递 ·

本文介绍了一种基于SLU度量标准的非可区分序列损失作为语义误差的代理，并使用REINFORCE技巧训练ASR和SLU模型的方法。作者在开放SLU数据集上展示了自定义序列损失训练的最新技术水平，并在大型专有数据集上显示了6%的相对改进。同时，作者还展示了如何使用语义反馈单独更新ASR和SLU模型。

关于内部语言模型与序列判别式训练在神经传达器中的关系

BriefGPT - AI 论文速递 ·