机器之心 ·

这AI绝对偷了格莱美奖杯！直接把LLaMA喂成乐坛顶流：开源版Suno来了！

💡 原文中文，约3000字，阅读约需7分钟。

📝

内容提要

AI音乐生成模型YuE能够生成长达5分钟的歌曲，结合了歌声合成与伴奏生成，表现优异。其创新的双轨建模和上下文学习策略显著提升了模仿多种风格的能力，甚至能生成与知名歌手相似的声音。

🎯

🔎

YuE模型通过双轨建模和上下文学习策略，成功实现了歌声合成与伴奏生成的联合建模。这种创新使得YuE在生成长达5分钟的歌曲时，能够保持高质量的音频输出，超越了许多现有的闭源音乐生成模型。

作为第一个开源的全曲级歌曲生成基座，YuE的推出可能会对音乐创作领域产生深远影响。开源意味着更多的开发者和音乐人可以参与到模型的改进和应用中，推动音乐生成技术的进一步发展。

尽管YuE在模仿风格和声音方面表现出色，但过度依赖模型生成的音乐可能导致创作的同质化。音乐创作需要保持独特性，使用者应注意避免简单复制模型生成的内容，以保持创作的原创性和多样性。

❓

YuE模型能够生成长达5分钟的歌曲，结合歌声合成与伴奏生成，表现优异。

YuE采用双轨建模和上下文学习策略，显著提升了模仿多种风格的能力。

YuE是第一个开源的全曲级歌曲生成基座，能够同时生成专业级歌声和伴奏，且生成时长和人声音域上与国际领先水平相当。

Dual-NTP策略实现了歌声合成和音乐伴奏生成的联合建模，避免了信息损失，确保了轨间对齐。

YuE引入了特有的上下文学习（Music ICL），延迟激活策略保护了模型的音乐性和创造力。

YuE的embedding质量优秀，表征质量与最新的自监督学习模型相当，且查重率低于人类翻唱。

🏷️