小红花·文摘 - 小红花技术领袖俱乐部

Fish Audios Generation API 对接说明

Fish Audios Generation API 对接说明

静觅 ·

语音技术是AI技术之一，应用广泛。大型云计算公司已开源AI语音能力，开发者可基于此搭建应用。音色克隆项目GPT-SoVITS开源后受到热捧，可通过提供5秒语音样本克隆语音。教程已上线，可自定义音色。

内含教程丨音色克隆模型 GPT-SoVITS，5 秒语音就能克隆出相似度 95% 的声音

HyperAI超神经 ·

本文以飞桨语音模型库PaddleSpeech提供的语音合成技术为核心，实现文本书籍转换为有声读物的功能，并实现音色克隆、语速设置、音量调整等附加功能，可以简单快速地实现语音合成，轻松实现书籍有声化。PaddleSpeech还提供了语音识别、声纹提取、标点恢复等其他功能。

自制有声书阅读器：用PaddleSpeech打开读书新方式

百度大脑 ·