基于集体学习机制的最优传输生成对抗网络用于非平行语音转换
📝
内容提要
本研究解决了当前生成对抗网络(GAN)在语音转换中生成语音自然性差的问题,提出了名为CLOT-GAN的模型,该模型采用集体学习机制集成多种判别器,提高了对mel-谱图形式分布的理解。实验结果表明,CLOT-GAN-VC模型在多个数据集上的表现优于现有的语音转换模型,展现了较强的潜在影响力。
➡️
本研究解决了当前生成对抗网络(GAN)在语音转换中生成语音自然性差的问题,提出了名为CLOT-GAN的模型,该模型采用集体学习机制集成多种判别器,提高了对mel-谱图形式分布的理解。实验结果表明,CLOT-GAN-VC模型在多个数据集上的表现优于现有的语音转换模型,展现了较强的潜在影响力。