Interspeech 2024 离散语音单元挑战中的语音处理技术报告
原文中文,约300字,阅读约需1分钟。发表于: 。本文介绍了上海交通大学 X-LANCE 小组在 Interspeech 2024 离散语音单元挑战赛的 TTS(声学 + vocoder)、SVS 和 ASR 任务中开发的系统,尤其是在 TTS 任务中,无论是使用整个训练集还是仅 1 小时训练数据,我们在排行榜中均获得了第一名,且比其他所有提交的系统具有最低比特率。
NPU-ASLP-LiAuto在2023年中国连续视觉语音识别挑战赛中推出了一种视觉语音识别系统,在单人任务中取得了34.76%的CER,在多人任务中取得了41.06%的CER,在所有三个赛道中排名第一。