无样本语音转换的扩散变换器
发表于: 。本研究针对传统无样本语音转换中的声音音色泄漏、音色表示不足及训练与推理任务不匹配的问题,提出了一种新颖的框架Seed-VC。该框架通过引入外部音色转换器和扩散变换器,有效捕捉细致的音色特征,并在实验中显示出相较于现有基准更高的说话人相似度和更低的词错误率,推动了更准确、多样化的语音转换系统的发展。
本研究针对传统无样本语音转换中的声音音色泄漏、音色表示不足及训练与推理任务不匹配的问题,提出了一种新颖的框架Seed-VC。该框架通过引入外部音色转换器和扩散变换器,有效捕捉细致的音色特征,并在实验中显示出相较于现有基准更高的说话人相似度和更低的词错误率,推动了更准确、多样化的语音转换系统的发展。