💡
原文中文,约1000字,阅读约需3分钟。
📝
内容提要
ZEGO 实时互动 AI Agent v2.8.0 于 2025 年 12 月 9 日发布,新增多模态大模型支持、OpenAI Responses API 标准和火山TTS情绪标签,优化了用户互动体验和智能体状态管理。
🎯
关键要点
-
ZEGO 实时互动 AI Agent v2.8.0 于 2025 年 12 月 9 日发布。
-
新增支持多模态大模型,符合 OpenAI 标准的文字输入语音输出。
-
支持 OpenAI Responses API 标准,能够调用符合该标准的大语言模型或智能体。
-
支持火山单向流式 TTS 的情绪标签,实现更好的情绪展现。
-
支持服务端 API 实现插入上下文消息,管理智能体的短期记忆。
-
优化用户结束说话判断逻辑,提升互动体验。
-
新增 AgentId、Name 等信息,便于区分不同业务的智能体。
-
优化智能体状态回调,新增状态事件以实现更精确的状态展示和业务逻辑控制。
❓
延伸问答
ZEGO 实时互动 AI Agent v2.8.0 的主要新功能是什么?
主要新功能包括支持多模态大模型、OpenAI Responses API 标准和火山TTS情绪标签。
ZEGO AI Agent 如何支持多模态大模型?
ZEGO AI Agent 支持符合 OpenAI 标准的文字输入语音输出的多模态大模型,如 gpt-4o-audio 和 qwen3-omni-flash。
火山单向流式 TTS 的情绪标签有什么作用?
火山单向流式 TTS 的情绪标签可以实现 AI 语音更好的情绪展现,如愤怒、悲伤和恐惧等。
ZEGO AI Agent 如何管理智能体的短期记忆?
通过服务端 API 插入上下文消息,智能体能够记住最近的互动内容,从而实现短期记忆管理。
ZEGO AI Agent 的用户互动体验如何优化?
优化了用户结束说话判断逻辑,提升了互动体验。
ZEGO AI Agent 的状态回调有哪些新变化?
新增了智能体实例状态回调事件,包括 IDLE、LISTENING、THINKING 和 SPEAKING 状态,以实现更精确的状态展示。
➡️