小红花·文摘

本研究探讨自监督学习在演讲者识别中的应用，发现语音预测损失、数据规模和模型大小是关键因素。实验表明，所提模型在降低计算成本的同时显著减少了单词错误率。此外，研究分析了自监督学习在语音分离和自动语音识别中的有效性，并提出了改进模型性能的方法。