DisMix:为源级音高和音色操控解构多种音乐乐器的混合

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

Timbre-Trap是一个新型框架,通过利用音高和音色之间的强分离性,将音乐转录和音频重建相统一。该框架的性能可与最先进的无特定乐器转录方法相媲美,而只需要少量的带注释数据。

🎯

关键要点

  • Timbre-Trap是一个新型框架,结合音乐转录和音频重建。
  • 该框架利用音高和音色之间的强分离性。
  • 通过训练U-Net模型,估计音高显著性和重建复杂谱系数。
  • 在解码阶段通过简单的切换机制选择输出。
  • 框架性能可与最先进的无特定乐器转录方法相媲美。
  • 只需少量的带注释数据即可实现高性能。
➡️

继续阅读