从旋律音符序列到音高的word2vec应用

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提出了MelodyGLM,一个多任务预训练框架,能够生成具有长期结构的旋律。通过使用melodic n-gram和长跨度抽样策略,构建了一个包含40万旋律片段的数据集。评估结果表明,MelodyGLM在旋律质量上显著优于传统方法,接近人类创作水平。

🎯

关键要点

  • 该研究提出了MelodyGLM,一个多任务预训练框架,用于生成带有长期结构的旋律。
  • 研究使用melodic n-gram和长跨度抽样策略来创建本地和全局填充任务。
  • 构建了一个包含超过40万旋律片段的大规模符号旋律数据集,用于大规模预训练和领域特定的n-gram词典构建。
  • 主观和客观评估结果表明,MelodyGLM在旋律连续性、节奏性、结构性和整体质量方面显著优于传统方法。
  • MelodyGLM在旋律填充任务上几乎与人类创作的旋律的质量相媲美。
➡️

继续阅读