Apple Machine Learning Research ·

2025年国际语音通信会议语音可及性项目挑战

Q: 该挑战使用了多少小时的数据？

挑战利用了超过400小时的数据。

Q: 在字错误率（WER）方面，表现最好的队伍达到了什么水平？

表现最好的队伍的WER为8.11%。

Q: 有多少支队伍在语义评分（SemScore）上表现优异？

17支队伍在语义评分上表现优异。

Q: 该挑战对未来的自动语音识别系统有什么影响？

为未来ASR系统设定了新的基准。

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

自动语音识别（ASR）系统在过去十年取得了显著进展，但对有语言障碍个体的表现仍然不足。为了解决这一问题，2025年启动了语音可及性项目挑战，利用超过400小时的来自500多名有语言障碍个体的数据。挑战评估结果显示，12支队伍在字错误率（WER）上超越基线，17支队伍在语义评分（SemScore）上表现优异，最高队伍的WER为8.11%，SemScore为88.44%。

🎯

关键要点

自动语音识别（ASR）系统在过去十年取得显著进展，但对有语言障碍个体的表现仍然不足。
为了解决这一问题，2025年启动了语音可及性项目挑战，利用超过400小时的数据。
挑战评估结果显示，12支队伍在字错误率（WER）上超越基线，17支队伍在语义评分（SemScore）上表现优异。
最高队伍的WER为8.11%，SemScore为88.44%，为未来ASR系统设定了新基准。

🔎

延伸解读

语音可及性项目的重要性

随着自动语音识别（ASR）技术的进步，针对有语言障碍个体的应用仍显不足。2025年语音可及性项目挑战的启动，旨在填补这一空白，利用丰富的数据集提升ASR系统的表现，确保更多人能够享受到技术带来的便利。

评估标准与结果分析

本次挑战采用字错误率（WER）和语义评分（SemScore）作为评估标准，12支队伍在WER上超越基线，显示出技术的进步。尤其是最高队伍的表现，为未来的ASR系统设定了新的标杆，值得关注其背后的技术创新。

数据收集的挑战与机遇

本项目利用超过400小时的来自500多名有语言障碍个体的数据，这一数据的多样性为ASR系统的训练提供了良好的基础。然而，数据收集的复杂性和代表性问题仍需关注，以确保系统的普适性和有效性。

❓

延伸问答

2025年语音可及性项目挑战的主要目标是什么？

主要目标是提高自动语音识别系统对有语言障碍个体的表现。

该挑战使用了多少小时的数据？