为什么扰动符号音乐是必要的:通过联合概率扩散模型拟合从未使用音符的分布
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于组成层次结构的音乐作品建模方法,通过分层语言模型生成具有可识别结构和高音质的音乐作品。模型具有灵活的可控性,用户可以通过采样或调整外部表示来控制音乐的流动。
🎯
关键要点
- 提出了一种基于组成层次结构的音乐作品建模方法。
- 通过定义分层语言对流行歌曲的符号化表示进行建模。
- 训练了级联扩散模型以生成分层语言模型。
- 模型能够生成具有可识别的全局歌词 - 副歌结构和协调音的完整音乐作品。
- 生成的音乐质量高于基准模型。
- 模型具有灵活的可控性,用户可以通过采样或调整外部表示来控制音乐的流动。
➡️