ZEGO 实时互动 AI Agent v2.8.0 发布,新增支持多模态大模型等功能

ZEGO 实时互动 AI Agent v2.8.0 发布,新增支持多模态大模型等功能

💡 原文中文,约1000字,阅读约需3分钟。
📝

内容提要

ZEGO 实时互动 AI Agent v2.8.0 于 2025 年 12 月 9 日发布,新增多模态大模型支持、OpenAI Responses API 标准和火山TTS情绪标签,优化了用户互动体验和智能体状态管理。

🎯

关键要点

  • ZEGO 实时互动 AI Agent v2.8.0 于 2025 年 12 月 9 日发布。

  • 新增支持多模态大模型,符合 OpenAI 标准的文字输入语音输出。

  • 支持 OpenAI Responses API 标准,能够调用符合该标准的大语言模型或智能体。

  • 支持火山单向流式 TTS 的情绪标签,实现更好的情绪展现。

  • 支持服务端 API 实现插入上下文消息,管理智能体的短期记忆。

  • 优化用户结束说话判断逻辑,提升互动体验。

  • 新增 AgentId、Name 等信息,便于区分不同业务的智能体。

  • 优化智能体状态回调,新增状态事件以实现更精确的状态展示和业务逻辑控制。

延伸问答

ZEGO 实时互动 AI Agent v2.8.0 的主要新功能是什么?

主要新功能包括支持多模态大模型、OpenAI Responses API 标准和火山TTS情绪标签。

ZEGO AI Agent 如何支持多模态大模型?

ZEGO AI Agent 支持符合 OpenAI 标准的文字输入语音输出的多模态大模型,如 gpt-4o-audio 和 qwen3-omni-flash。

火山单向流式 TTS 的情绪标签有什么作用?

火山单向流式 TTS 的情绪标签可以实现 AI 语音更好的情绪展现,如愤怒、悲伤和恐惧等。

ZEGO AI Agent 如何管理智能体的短期记忆?

通过服务端 API 插入上下文消息,智能体能够记住最近的互动内容,从而实现短期记忆管理。

ZEGO AI Agent 的用户互动体验如何优化?

优化了用户结束说话判断逻辑,提升了互动体验。

ZEGO AI Agent 的状态回调有哪些新变化?

新增了智能体实例状态回调事件,包括 IDLE、LISTENING、THINKING 和 SPEAKING 状态,以实现更精确的状态展示。

➡️

继续阅读