通过通用语义映射残差块减轻声音转换中的音色泄露

📝

内容提要

本研究针对声音转换中源说话者的音色信息泄露问题,提出了一种新的解决方案,即引入残差块作为内容提取器。研究证明,通过通用语义字典的内容特征重表达模块,该方法能够有效减轻音色泄露,从而显著提高目标说话者的相似度。

➡️

继续阅读