量子位 ·

声网刘斌：“Her”真正落地实现离不开RTE能力的支撑｜MEET 2025

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

声网首席运营官刘斌在MEET 2025大会上指出，RTE能力是AI Agent应用落地的关键。声网致力于提供低延迟的实时互动体验，支持多模态对话，并通过与OpenAI和MiniMax的合作推动Realtime API的发展，以确保高效互动。

🎯

🔎

声网首席运营官刘斌强调，RTE（实时互动能力）是AI Agent应用成功落地的关键。低延迟和多模态对话的实现，依赖于强大的RTE技术支持，这意味着在设计AI应用时，必须优先考虑实时互动的能力，以提升用户体验。

声网的SD-RTN网络确保音视频传输在400毫秒内完成，但在不同网络环境下，尤其是弱网情况下，保持低延迟仍然是一个挑战。开发者在构建AI Agent时，需要考虑如何在各种终端和网络条件下优化互动体验，以确保应用的普适性和稳定性。

多模态对话的实现不仅依赖于技术的进步，还需要在用户交互中实现自然流畅的体验。刘斌提到，延迟低于1.7秒是关键，这要求开发者在设计时关注实时性和交互的双向性，以提升AI Agent的实用性和用户满意度。

❓

RTE能力是AI Agent应用落地的关键，确保低延迟和高效互动。

声网致力于提供低延迟的实时互动体验，确保延迟低于1.7秒，并支持打断交互。

声网与OpenAI和MiniMax合作，推动Realtime API的发展。

声网的SD-RTN网络确保音视频传输在400毫秒内到达，提供稳定的实时互动。

声网是全球最大的实时互动云服务商，单月音视频使用时长达700亿分钟。

AI QoE是针对AI模型的用户体验优化，涵盖VAD技术和噪音消除等新方法。

🏷️