实时互动网 ·

ZEGO 实时互动 AI Agent v2.9.0 发布，新增 TTS 支持过滤特定字符串等功能

Q: 通过 Responses API 调用豆包 Seed 系列模型有什么优势？

可以自动开启缓存，降低互动延迟和成本。

💡 原文中文，约1100字，阅读约需3分钟。

📝

内容提要

ZEGO 实时互动 AI Agent v2.9.0 发布，新增 TTS 文本转语音功能，支持特定字符串过滤。通过 Responses API 调用豆包 Seed 系列模型时可自动开启缓存，降低互动延迟和成本。同时优化了语音实例和数字人实例的互动延迟，并修复了回调问题。

🎯

关键要点

ZEGO 实时互动 AI Agent v2.9.0 版本发布，新增 TTS 文本转语音功能。
TTS 支持过滤特定字符串，避免对特定内容进行语音合成。
控制文本过滤有三种方式：起止符、终止符和字符过滤。
通过 Responses API 调用豆包 Seed 系列模型时可自动开启缓存，降低互动延迟和成本。
优化了语音实例和数字人实例的互动延迟，降低约 100ms。
修复了 UserAudioData 回调不可用问题。

🔎

延伸解读

TTS 功能的实用性

ZEGO 的 TTS 功能通过过滤特定字符串，提升了语音合成的准确性和用户体验。在陪伴类应用中，能够有效避免不必要的语音输出，使对话更加自然流畅。开发者可以根据需求灵活设置过滤规则，增强应用的互动性。

缓存机制的优势

新版本中自动开启的缓存机制显著降低了互动延迟和成本。这对于需要实时反馈的应用场景尤为重要，能够提升用户体验并减少服务器负担。开发者应考虑如何利用这一功能来优化应用性能。

文本过滤方式的灵活性

ZEGO 提供了三种文本过滤方式，开发者可以根据具体需求选择合适的方式。这种灵活性使得 TTS 功能能够适应不同场景，尤其是在需要控制语音内容的情况下，能够有效提升内容的可控性和安全性。

❓

延伸问答

ZEGO 实时互动 AI Agent v2.9.0 的新功能有哪些？

新增 TTS 文本转语音功能，支持特定字符串过滤，自动开启缓存能力等。

如何使用 TTS 的字符串过滤功能？

可以通过起止符、终止符和字符过滤三种方式来控制文本过滤。

TTS 支持过滤哪些特定字符串？

支持过滤符号如“*”、“-”等特定字符串。

通过 Responses API 调用豆包 Seed 系列模型有什么优势？