本文介绍了一种新方法,通过自监督学习提取目标话语的风格信息,并将其转移到源语音中,以实现目标说话者的风格再现。该方法结合扩散式解码器,提高了语音转换任务中的说话者相似性,尤其在长话语的计算复杂度上表现良好。
完成下面两步后,将自动完成登录并继续当前操作。