ZEGO 实时互动 AI Agent v2.9.0 发布,新增 TTS 支持过滤特定字符串等功能

ZEGO 实时互动 AI Agent v2.9.0 发布,新增 TTS 支持过滤特定字符串等功能

💡 原文中文,约1100字,阅读约需3分钟。
📝

内容提要

ZEGO 实时互动 AI Agent v2.9.0 发布,新增 TTS 文本转语音功能,支持特定字符串过滤。通过 Responses API 调用豆包 Seed 系列模型时可自动开启缓存,降低互动延迟和成本。同时优化了语音实例和数字人实例的互动延迟,并修复了回调问题。

🎯

关键要点

  • ZEGO 实时互动 AI Agent v2.9.0 版本发布,新增 TTS 文本转语音功能。
  • TTS 支持过滤特定字符串,避免对特定内容进行语音合成。
  • 控制文本过滤有三种方式:起止符、终止符和字符过滤。
  • 通过 Responses API 调用豆包 Seed 系列模型时可自动开启缓存,降低互动延迟和成本。
  • 优化了语音实例和数字人实例的互动延迟,降低约 100ms。
  • 修复了 UserAudioData 回调不可用问题。

延伸问答

ZEGO 实时互动 AI Agent v2.9.0 的新功能有哪些?

新增 TTS 文本转语音功能,支持特定字符串过滤,自动开启缓存能力等。

如何使用 TTS 的字符串过滤功能?

可以通过起止符、终止符和字符过滤三种方式来控制文本过滤。

TTS 支持过滤哪些特定字符串?

支持过滤符号如“*”、“-”等特定字符串。

通过 Responses API 调用豆包 Seed 系列模型有什么优势?

可以自动开启缓存,降低互动延迟和成本。

ZEGO 实时互动 AI Agent v2.9.0 在互动延迟方面做了哪些优化?

优化了语音实例和数字人实例的互动延迟,降低约 100ms。

如何解决 UserAudioData 回调不可用的问题?

在 ZEGO 实时互动 AI Agent v2.9.0 中已修复该问题。

➡️

继续阅读