💡
原文英文,约200词,阅读约需1分钟。
📝
内容提要
GLM-TTS是Zai推出的文本转语音项目,专注于可控的情感和语音风格生成。它采用零样本多奖励强化学习,能够生成特定情感的自然语音,支持情感强度和语速等多维度控制,适用于语音助手和有声书等场景。
🎯
关键要点
- GLM-TTS是Zai推出的文本转语音项目,专注于可控的情感和语音风格生成。
- 采用零样本多奖励强化学习,增强合成语音的情感表现力和自然性。
- 支持生成特定情感的语音,适用于未见示例。
- 具备强大的可控性,包括情感强度、语速和音色等多维度控制。
- 多奖励训练优化语音质量和情感一致性。
- 以Apache-2.0开源许可证发布,便于社区重用和扩展。
- 适用于语音助手和对话系统,提供更自然和富有情感的响应。
- 可用于有声书和内容配音,自动适应叙述风格与内容情感。
- 支持新语言/风格的快速原型制作,进行零样本实验。
- 为创作者提供对语音风格合成的细粒度控制。
➡️