阶跃星辰与吉利汽车集团合作开源Step-Audio-TTS-3B模型,能够精准演绎方言特色,支持RAP和哼唱生成,填补音乐语音合成的空白。该模型基于大规模数据集训练,现已上线HyperAI官网,提供语音合成、音乐合成和语音克隆功能。
本文介绍了AI WebTV的构建过程,展示了自动视频和音乐合成的最新进展。它使用开源的文本到视频模型,如Zeroscope和MusicGen,以娱乐和易于访问的方式展示生成的视频。文章还介绍了AI WebTV的架构和实现过程,包括使用NodeJS和TypeScript实现,使用Hugging Face上的各种服务,以及调用视频链和广播流的方法。此外,文章还提供了一些生成的内容的示例,并讨论了一些观察结果和未来的工作。
完成下面两步后,将自动完成登录并继续当前操作。