DisMix:为源级音高和音色操控解构多种音乐乐器的混合
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
Timbre-Trap是一个新型框架,通过利用音高和音色之间的强分离性,将音乐转录和音频重建相统一。该框架的性能可与最先进的无特定乐器转录方法相媲美,而只需要少量的带注释数据。
🎯
关键要点
- Timbre-Trap是一个新型框架,结合音乐转录和音频重建。
- 该框架利用音高和音色之间的强分离性。
- 通过训练U-Net模型,估计音高显著性和重建复杂谱系数。
- 在解码阶段通过简单的切换机制选择输出。
- 框架性能可与最先进的无特定乐器转录方法相媲美。
- 只需少量的带注释数据即可实现高性能。
➡️