最近的研究发现,现代音频生成模型能够生成高保真声音,与音乐、事件和人类活动相关。本文通过实验评估了合成音频在音频识别和语音相关建模中的质量,并展示了其潜力。
Stability AI的音频生成模型Stable Audio 2.0允许用户上传音频样本并使用提示进行转换,创作AI生成的歌曲。Stable Audio 2.0提供完整的三分钟音频片段,与广播歌曲长度相同。Stable Audio免费并公开提供,通过网站和API。与Voice Engine不同,Stable Audio 2.0能够创建完整的歌曲。
完成下面两步后,将自动完成登录并继续当前操作。