一种音调感知的循环连接模型:基于 TRACX2 的探索
原文中文,约400字,阅读约需1分钟。发表于: 。在这篇研究论文中,我们通过探索 TRACX2 模型如何应用于基本旋律感知来回答相似或相同的机制是否用于语音分割、串行图像处理和音乐处理的计算建模。TRACX2 模型是一个基于识别的递归连接主义自编码器模型,成功地模拟了语音和串行图像处理,并通过训练法国儿童简单歌曲的音调间隔来动态地将内部表示整合到新的输入中,以实现音乐分块。研究结果表明,TRACX2...
研究人员提出了两种新的TTS方法:Diff-LM-Speech和Tetra-Diff-Speech。Diff-LM-Speech使用mel-spectrogram和提示编码结构提高语义表示能力,Tetra-Diff-Speech通过持续时间扩散模型实现多样化的韵律表达。实验结果显示这些方法优于基准方法。