使用自我监督语音特征进行说话人识别时可以去除下游模型吗?
原文英文,约200词,阅读约需1分钟。发表于: 。Self-supervised features are typically used in place of filter-bank features in speaker verification models. However, these models were originally designed to ingest filter-banks as inputs, and...
自我监督特征在说话人验证模型中起到重要作用,本研究发现预训练的自我监督语音特征可以简化下游模型并提高性能。通过重新设计模型,我们证明可以使用更少的参数并获得更好的性能。在SUPERB上,我们实现了29.93%的平均性能提升。简化的下游模型比基线更具数据效率,只需使用60%的训练数据即可获得更好的性能。