小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
VibeVoice-1.5B:微软开源文本转语音模型,可合成四个不同说话者长达 90 分钟的语音

微软的VibeVoice-1.5B是开源文本转语音技术的重大进展,支持长达90分钟的多说话人音频生成,具备跨语言和歌唱合成能力,采用流式架构,强调情感表现,适合播客和对话场景。

VibeVoice-1.5B:微软开源文本转语音模型,可合成四个不同说话者长达 90 分钟的语音

实时互动网
实时互动网 · 2025-08-26T07:05:45Z

本研究提出了一种名为MultiActor-Audiobook的零样本有声书生成方法,能够自动生成具有一致性和表现力的语调与情感,无需额外训练,从而提升有声书的情感表现力。

Multi-Actor Audiobook: Zero-Shot Audiobook Generation Based on Multiple Speakers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z
推进可扩展的文本转语音合成:Llasa 基于 Transformer 的框架可提高语音质量和情感表达能力

研究表明,扩展推理时间计算可提升语音合成质量。Llasa 模型采用单级 TTS 架构,优化语音标记生成,增强自然度和情感表现。实验结果显示该模型在多个指标上表现优异,鼓励进一步研究。

推进可扩展的文本转语音合成:Llasa 基于 Transformer 的框架可提高语音质量和情感表达能力

实时互动网
实时互动网 · 2025-02-12T02:33:18Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码