基于神经自回归模型的高效实时钢琴转录

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该研究使用基于WaveNet架构的新型合成模型,对参数声码器产生的特征进行建模,并使用混合密度输出,成功将和声、非周期性和有声/无声组件预测在一起,比现有的方法更为有效。

🎯

关键要点

  • 研究使用基于WaveNet架构的新型合成模型。
  • 对参数声码器产生的特征进行建模。
  • 使用混合密度输出实现每个帧的预测。
  • 避免了过度拟合。
  • 在预测错误情况下进行自回归生成算法的正则化。
  • 成功将和声、非周期性和有声/无声组件预测在一起。
  • 比现有的参数化统计方法和拼接方法更为有效。
➡️

继续阅读