探讨用于韵律建模的音素级语音编解码器中的解耦

📝

内容提要

本研究针对现有语音韵律建模方法中依赖于全局风格表示的不足,探索了基于残差向量量化的音素级编解码器的韵律建模能力。通过对编码器和解码器进行语言表示的条件处理,研究结果表明,该方法在解耦效果上取得了显著进展,能够有效捕捉韵律信息,其潜在空间具有可解释的结构,主要成分与音调和能量相关联。

🏷️

标签

➡️

继续阅读