本文介绍了一种新的自监督学习方法——发音者无关聚类(Spin),通过微调聚类语音表示,提升语音识别和声学单元发现的效果。同时提出了Robust Spin(R-Spin)框架,增强内容表征并减少计算资源消耗。研究表明,语义标记在多任务中优于压缩标记,并提出了系统化评估框架STAB,以推动语音标记器的发展。
完成下面两步后,将自动完成登录并继续当前操作。