该论文介绍了一种由文本指令引导的新颖语音转换模型,能够增加语音转换的多样性和特定性。该模型以端到端的方式处理语音信息,利用文本指令修改给定语音的韵律和情感信息。实验证明了该模型在理解指令并产生合理结果方面的能力。
完成下面两步后,将自动完成登录并继续当前操作。