小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

PaddleSpeech是基于飞桨的开源语音项目,最新发布的1.5.0版本适配飞桨3.0,新增DAC模型支持和AudioTools模块,优化了音频处理功能和损失函数,提高了模型的准确性和易用性。

重磅更新!PaddleSpeech r1.5.0 整体适配飞桨框架3.0,新增大模型音频编码器DAC组件

百度大脑
百度大脑 · 2025-06-23T12:33:29Z
批量生成,本地推理,人工智能声音克隆框架PaddleSpeech本地批量克隆实践(Python3.10)

本文介绍了如何在本地配置PaddleSpeech进行语音合成的本地推理,包括下载音色模型和声码器,编写推理脚本等。同时,提供了两个声码器对象的选择,以及一个音频内容的字典用于生成音频文件。最后,给出了一个基于声学模型FastSpeech2的鬼畜视频一键生成项目的链接。

批量生成,本地推理,人工智能声音克隆框架PaddleSpeech本地批量克隆实践(Python3.10)

刘悦
刘悦 · 2023-06-15T00:00:00Z
声音克隆,精致细腻,人工智能AI打造国师“一镜到底”鬼畜视频,基于PaddleSpeech(Python3.10)

本文介绍如何使用PaddleSpeech克隆声音并制作鬼畜视频,需要准备干净的声音样本,进行数据集清洗和切分,可在云端或本地部署训练和推理,提供国师克隆语音模型下载链接和鬼畜视频。

声音克隆,精致细腻,人工智能AI打造国师“一镜到底”鬼畜视频,基于PaddleSpeech(Python3.10)

刘悦
刘悦 · 2023-06-14T00:00:00Z

本文以飞桨语音模型库PaddleSpeech提供的语音合成技术为核心,实现文本书籍转换为有声读物的功能,并实现音色克隆、语速设置、音量调整等附加功能,可以简单快速地实现语音合成,轻松实现书籍有声化。PaddleSpeech还提供了语音识别、声纹提取、标点恢复等其他功能。

Creating Your Own Audiobook Reader: A New Way to Read with PaddleSpeech

百度大脑
百度大脑 · 2023-03-03T10:36:25Z

听说IT圈十个人里有九个是男性开发者,女生并不多,陈雪儿可以算是这个群体中独特的存在。作为杭州谐云科技有限公司(简称谐云)智能边缘团队的AI技术专家,陈雪儿带领团队历经一年半研发的“金融双录智能质检系统”,能为银行降低90%的人力成本,引入边缘计算后,将双录质检实时性从原来的传统事后质检小时级别提高到了秒级,双录成功率整体提高了30%。刚开始聊到与AI相关的话题时,陈雪儿显得有点儿腼腆。她坦言,自...

实时性升至秒级!飞桨PaddleSpeech赋能金融双录业务走向智能化

百度大脑
百度大脑 · 2023-01-09T12:39:44Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码