Interspeech 2026 第二届音频编码器能力挑战赛正式启动

Interspeech 2026 第二届音频编码器能力挑战赛正式启动

💡 原文中文,约2600字,阅读约需7分钟。
📝

内容提要

国际语音会议Interspeech 2026将于2026年9月在悉尼举行,期间将举办音频编码器能力挑战赛(AECC)。比赛聚焦音频编码器在复杂场景下的表现,参赛者需提交预训练模型,主办方提供评估系统。参赛者可使用公开数据集,报名截止日期为2026年1月25日。

🎯

关键要点

  • 国际语音会议Interspeech 2026将于2026年9月在悉尼举行。

  • 将举办音频编码器能力挑战赛(AECC),由小米、萨里大学、清华大学、海天瑞声联合发起。

  • 比赛聚焦音频编码器在复杂场景下的表现,参赛者需提交预训练模型。

  • 主办方提供评估系统XARES-LLM,参赛者无需自己运行该系统。

  • 训练数据必须是公开可访问的,不得使用私有保密数据。

  • 比赛设置两个赛道:赛道A关注传统分类任务,赛道B关注理解和表达能力。

  • 报名截止日期为2026年1月25日,参赛者需在此之前提交报名和模型。

  • 主办方提供补充数据集,涵盖多种环境噪声,供参赛者免费使用。

  • 技术报告需在2026年2月25日前提交,且可作为会议论文投稿。

🔎

延伸解读

挑战赛的意义

音频编码器能力挑战赛(AECC)旨在推动音频大语言模型(LALMs)的发展,尤其是在复杂场景下的表现。通过鼓励多样化的模型设计,参赛者可以探索不同的编码器架构,从而提升音频理解能力,满足日益增长的应用需求。

数据集的重要性

本次挑战赛强调公开数据集的使用,确保参赛者在公平的环境中竞争。主办方提供的补充数据集涵盖多种环境噪声,帮助参赛者更好地训练模型。这种数据的多样性将有助于提高模型在真实世界中的适应性和鲁棒性。

赛道设置与评估

挑战赛分为两个赛道,分别关注传统分类任务和理解表达能力。参赛者无需选择赛道,所有提交作品将同时接受评估。这种设计不仅增加了参赛者的参与度,也为评估提供了更全面的视角,促进了不同技术的比较与进步。

延伸问答

Interspeech 2026的音频编码器能力挑战赛的主要目标是什么?

挑战赛主要评估音频编码器在复杂场景下的理解与特征表示能力。

参赛者需要提交什么类型的模型?

参赛者需提交预训练的音频编码器模型。

比赛的报名截止日期是什么时候?

报名截止日期为2026年1月25日。

比赛设置了多少个赛道?

比赛设置了两个赛道,赛道A和赛道B。

参赛者可以使用哪些类型的数据进行训练?

参赛者必须使用公开可访问的训练数据,不能使用私有保密数据。

主办方提供了什么样的评估系统?

主办方提供了开源的评估系统XARES-LLM,参赛者无需自己运行该系统。

🏷️

标签

➡️

继续阅读