小红花·文摘 - 小红花技术领袖俱乐部

推动多语言语音科技迈向新高度：INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

推动多语言语音科技迈向新高度：INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

机器之心 ·

本研究解决了在开发通用口语语言模型过程中缺乏全面评估基准的问题。作者提出动态SUPERB第二阶段，这是一个开放的、不断扩展的基准，以全面评估基于指令的通用语音模型，并引入了180个任务，大幅度提升了评估能力。研究发现，目前的模型在任务处理上存在普遍不足，亟需进一步创新。

动态SUPERB第二阶段：一个协作扩展的基准，用于测量口语语言模型的能力，共包含180个任务

BriefGPT - AI 论文速递 ·

本文介绍了WavLM预训练模型，利用Transformer结构的相对位置偏置来捕捉输入语音的顺序，提高了对非ASR语音任务的潜力，并在SUPERB基准测试上取得了最先进的性能。

LASER：通过自我监督学习对齐语音表示以改进内容相关任务

BriefGPT - AI 论文速递 ·

2022 SLT会议将举行超级挑战赛，旨在学习自监督语音表征以获得更好的性能、泛化性和效率。该挑战对流行的语音处理任务进行全面覆盖，实施度量标准来测量自监督学习表征的计算需求，并评估其在不同的超级任务上的泛化性能和性能。

Dynamic-SUPERB：面向语音的动态、协作和全面的教学调优基准

BriefGPT - AI 论文速递 ·