Instruct-MusicGen: 通过指令调整解锁面向音乐语言模型的文本到音乐编辑
原文中文,约400字,阅读约需1分钟。发表于: 。通过预训练的 MusicGen 模型进行微调,我们引入 Instruct-MusicGen,它通过添加文本融合模块和音频融合模块,可以同时处理指令文本和音频输入,从而实现高效的文本转音乐编辑,提高了音乐语言模型在动态音乐制作环境中的应用广度。
可控音乐生成对于人工智能与人类共创音乐至关重要。通过引入参数高效微调(PEFT)方法,自回归语言模型可以解决音乐修复任务。PEFT方法结合了基于帧级内容的控制,便于音轨调节和谱面调节。实验显示有希望的结果,为未来的AI音乐编辑工具提供了更灵活的控制。