该论文介绍了R-Spin,一种高效的自监督微调框架,能够在噪声环境中保持语音表征的稳定性。R-Spin通过预测声学片段增强内容表征,在严重扭曲的语音情况下,计算资源减少12倍且表现更佳。
2022 SLT会议将举行超级挑战赛,旨在学习自监督语音表征以获得更好的性能、泛化性和效率。该挑战对流行的语音处理任务进行全面覆盖,实施度量标准来测量自监督学习表征的计算需求,并评估其在不同的超级任务上的泛化性能和性能。
完成下面两步后,将自动完成登录并继续当前操作。