机器之心 ·

这AI绝对偷了格莱美奖杯！直接把LLaMA喂成乐坛顶流：开源版Suno来了！

💡 原文中文，约3000字，阅读约需7分钟。

📝

内容提要

AI音乐生成模型YuE能够生成长达5分钟的歌曲，结合了歌声合成与伴奏生成，表现优异。其创新的双轨建模和上下文学习策略显著提升了模仿多种风格的能力，甚至能生成与知名歌手相似的声音。

🎯

关键要点

AI音乐生成模型YuE能够生成长达5分钟的歌曲，结合了歌声合成与伴奏生成，表现优异。
YuE采用双轨建模和上下文学习策略，显著提升了模仿多种风格的能力。
YuE是第一个开源的全曲级歌曲生成基座，能够同时生成专业级歌声和伴奏。
YuE的Stage-1 LM联合建模文本条件和音频离散token序列，避免了信息损失。
YuE的Dual-NTP策略实现了歌声合成和音乐伴奏生成的联合建模。
结构化渐进生成（CoT）方法使得人声轨能在全曲范围内准确跟随歌词控制。
YuE引入了特有的上下文学习（Music ICL），保护了模型的音乐性和创造力。
YuE在生成时长和人声音域上与国际领先水平相当，查重率低于人类翻唱。
YuE的embedding质量优秀，表征质量与最新的自监督学习模型相当。

🏷️

继续阅读

科研AI出了个狠角色：开源30B小模型，硬刚Gemini和Claude
UniScientist是一个开源的30B参数AI模型，能够实现科研闭环，包括提出假设、收集证据和验证。通过动态系统建模和人类专家的验证，该模型提升了科研...
将AI应用从原型转向生产需要企业级Postgres基础设施
AI应用在数据库限制、集成复杂性和合规性方面面临挑战，尤其在金融和医疗等受监管行业。pgEdge推出企业级Postgres基础设施，以支持AI应用的安全性...
AI编码代理可以编写代码，Crafting希望帮助他们交付
Crafting CEO Sumeet Vaidya表示，六到九个月前，大家关注AI代理的快速代码生成，但他和联合创始人意识到，工程组织在扩展时面临协调和资源使用等挑战。
Mermaid+AI，告别“手搓”画流程图
本文提出了一种基于VMD-BiLSTM的电力负荷预测模型，通过变分模态分解提高预测精度。VMD将负荷数据分解为平稳成分，BiLSTM进行时序建模，最终合成...
2026年人们利用AI赚钱的7种方式
越来越多的人利用代理AI工具自动化工作并创造收入。到2026年，个人可通过小型系统轻松开展自由职业，常见收入模式包括工作流自动化、微型SaaS和AI辅助写...
2026年你应该尝试的6个最佳AI代理记忆框架
Bala Priya C是一位来自印度的开发者和技术作家，专注于数学、编程、数据科学和内容创作。她的兴趣包括DevOps、数据科学和自然语言处理，热爱阅读...

这AI绝对偷了格莱美奖杯！直接把LLaMA喂成乐坛顶流：开源版Suno来了！

内容提要

关键要点

标签

继续阅读