小红花·文摘

本研究提出ClapFM-EVC框架，旨在解决高保真情感语音转换中的灵活性和可解释性问题。该框架通过自然语言提示或参考语音生成高质量的转换语音，并能够调节情感强度，研究结果验证了其有效性。

ClapFM-EVC: High-Fidelity and Flexible Emotional Voice Conversion with Dual Control from Natural Language and Speech

BriefGPT - AI 论文速递 ·

本研究提出了一种基于序列到序列模型的 Duration-Flexible 情感语音转换方法，通过引入样式自编码器和单位对齐器，实现了并行语音生成，提高了转换的可靠性和效率。该方法通过跨注意机制将语言和语外信息与各种情感同步，并通过样式自编码器对样式元素进行解耦和操作。经过主客观评估证明了该方法在领域内的优越性。

DurFlex-EVC: 持续可变情感语音转换并行生成

BriefGPT - AI 论文速递 ·