本研究提出了一种条件感知自监督学习表示(CA-SSLR),通过整合语言和说话人嵌入,显著提升语音任务的模型表现,并减少训练参数数量。
本文介绍了WavLM预训练模型,利用Transformer结构的相对位置偏置来捕捉输入语音的顺序,提高了对非ASR语音任务的潜力,并在SUPERB基准测试上取得了最先进的性能。
本研究提出了两组新颖特征用于帕金森病严重度分类,实验证明这些特征在语音任务中表现优于传统的MFCC特征。
该研究提出了两组新颖特征用于帕金森病严重度分类,分别是基于单频滤波方法的SFF倒谱系数和基于SFF的MFCC。实验结果表明,这些特征在三个语音任务中均优于传统的MFCC特征,相对提高了5.8%至7.0%。
完成下面两步后,将自动完成登录并继续当前操作。