本文探讨了自我监督学习在语音任务中的应用,强调不同解码器架构对性能的影响。研究表明,自我监督学习能够生成特征,帮助理解语言习得及语音处理机制。提出通过多个神经编码器共同解决自监督任务,以提取讲话者身份、音素和情感线索等信息。尽管在多个领域取得突破,但高计算成本仍限制了模型的部署和研究。
该研究提出了两组新颖特征用于帕金森病严重度分类,分别是基于单频滤波方法的SFF倒谱系数和基于SFF的MFCC。实验结果表明,这些特征在三个语音任务中均优于传统的MFCC特征,相对提高了5.8%至7.0%。
完成下面两步后,将自动完成登录并继续当前操作。