ClapFM-EVC: High-Fidelity and Flexible Emotional Voice Conversion with Dual Control from Natural Language and Speech

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出ClapFM-EVC框架,旨在解决高保真情感语音转换中的灵活性和可解释性问题。该框架通过自然语言提示或参考语音生成高质量的转换语音,并能够调节情感强度,研究结果验证了其有效性。

🎯

关键要点

  • ClapFM-EVC框架旨在解决高保真情感语音转换中的灵活性和可解释性问题。

  • 该框架通过自然语言提示或参考语音生成高质量的转换语音。

  • ClapFM-EVC能够调节情感强度。

  • 研究结果通过主观和客观评估验证了ClapFM-EVC的有效性。

➡️

继续阅读