该研究探讨了变分自编码器(VAE)、反馈递归自编码器(FRAE)和音频频谱图变换器(AST)在语音情感识别和合成中的应用,显示出在特征提取和分类性能提升方面的优异表现,特别是在ZeroSpeech挑战中取得了显著成果。
完成下面两步后,将自动完成登录并继续当前操作。