声网刘斌:“Her”真正落地实现离不开RTE能力的支撑|MEET 2025

💡 原文中文,约3300字,阅读约需8分钟。
📝

内容提要

声网首席运营官刘斌在MEET 2025大会上指出,RTE能力是AI Agent应用落地的关键。声网致力于提供低延迟的实时互动体验,支持多模态对话,并通过与OpenAI和MiniMax的合作推动Realtime API的发展,以确保高效互动。

🎯

关键要点

  • 声网首席运营官刘斌在MEET 2025大会上强调RTE能力是AI Agent应用落地的关键。
  • 声网致力于提供低延迟的实时互动体验,支持多模态对话。
  • 声网与OpenAI和MiniMax合作推动Realtime API的发展。
  • 多模态对话体验的关键在于延迟低于1.7秒和能否打断交互。
  • 声网在全球音视频技术领域占据领先地位,单月音视频使用时长达700亿分钟。
  • AI Agent应用需要在端到端、全球任意地点、弱网环境和各种终端下实现低时延。
  • 声网的SD-RTN网络确保音视频传输在400毫秒内到达。
  • 声网正在优化人与模型之间的对话体验,提升AI QoE。
  • 声网的产品体系不断加强,包括Linux SDK、AI VAD能力和AI Agent Service的优化。
  • 任何涉及大模型多模态实时交互的应用都离不开RTC技术的支持。
➡️

继续阅读