为什么扰动符号音乐是必要的:通过联合概率扩散模型拟合从未使用音符的分布

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于组成层次结构的音乐作品建模方法,通过分层语言模型生成具有可识别结构和高音质的音乐作品。模型具有灵活的可控性,用户可以通过采样或调整外部表示来控制音乐的流动。

🎯

关键要点

  • 提出了一种基于组成层次结构的音乐作品建模方法。
  • 通过定义分层语言对流行歌曲的符号化表示进行建模。
  • 训练了级联扩散模型以生成分层语言模型。
  • 模型能够生成具有可识别的全局歌词 - 副歌结构和协调音的完整音乐作品。
  • 生成的音乐质量高于基准模型。
  • 模型具有灵活的可控性,用户可以通过采样或调整外部表示来控制音乐的流动。
➡️

继续阅读