小红花·文摘

该论文介绍了一种针对语音识别的自监督学习方法，通过使用随机投影量化器生成离散标签，从而学习模型预测被屏蔽掉的语音信号。实验结果表明，该方法在多语种任务中比旧有的模型具有更低的字错率和延迟。