💡
原文中文,约1100字,阅读约需3分钟。
📝
内容提要
ZEGO 实时互动 AI Agent v2.9.0 发布,新增 TTS 文本转语音功能,支持特定字符串过滤。通过 Responses API 调用豆包 Seed 系列模型时可自动开启缓存,降低互动延迟和成本。同时优化了语音实例和数字人实例的互动延迟,并修复了回调问题。
🎯
关键要点
- ZEGO 实时互动 AI Agent v2.9.0 版本发布,新增 TTS 文本转语音功能。
- TTS 支持过滤特定字符串,避免对特定内容进行语音合成。
- 控制文本过滤有三种方式:起止符、终止符和字符过滤。
- 通过 Responses API 调用豆包 Seed 系列模型时可自动开启缓存,降低互动延迟和成本。
- 优化了语音实例和数字人实例的互动延迟,降低约 100ms。
- 修复了 UserAudioData 回调不可用问题。
❓
延伸问答
ZEGO 实时互动 AI Agent v2.9.0 的新功能有哪些?
新增 TTS 文本转语音功能,支持特定字符串过滤,自动开启缓存能力等。
如何使用 TTS 的字符串过滤功能?
可以通过起止符、终止符和字符过滤三种方式来控制文本过滤。
TTS 支持过滤哪些特定字符串?
支持过滤符号如“*”、“-”等特定字符串。
通过 Responses API 调用豆包 Seed 系列模型有什么优势?
可以自动开启缓存,降低互动延迟和成本。
ZEGO 实时互动 AI Agent v2.9.0 在互动延迟方面做了哪些优化?
优化了语音实例和数字人实例的互动延迟,降低约 100ms。
如何解决 UserAudioData 回调不可用的问题?
在 ZEGO 实时互动 AI Agent v2.9.0 中已修复该问题。
➡️