💡
原文中文,约1600字,阅读约需4分钟。
📝
内容提要
该项目优化了Silero VAD的推理,性能提升约2.5倍,内存占用降低。引入新playbook,简化语音代理流程,支持SIP和LLM流式输出,适用于语音通话,延迟在800ms以内。
🎯
关键要点
- 该项目优化了Silero VAD的推理,性能提升约2.5倍,内存占用降低。
- 引入新playbook,简化语音代理流程,支持SIP和LLM流式输出。
- 适用于语音通话,延迟在800ms以内。
- 重新手写了Silero VAD的推理,使用纯Rust实现。
- TinySilero的性能比ONNX Silero快超过2.5倍。
- 提供基于markdown的参考方案,简化voice agent的使用。
- 保留了内置SIP支持的Voice-Agent SDK,支持与电话的对接。
- Active-call专注于语音通话,性能良好,支持200路并发。
- 仍然保留Websocket API,允许开发者控制通话。
❓
延伸问答
Active-call框架的主要性能提升是什么?
Active-call框架通过重新手写Silero VAD的推理,性能提升约2.5倍,内存占用降低。
Active-call支持哪些语音代理流程?
Active-call引入了新playbook,简化了语音代理流程,支持SIP和LLM流式输出。
Active-call的延迟表现如何?
Active-call的延迟基本在800ms以内,适合语音通话。
Active-call如何与电话系统对接?
Active-call保留了内置SIP支持的Voice-Agent SDK,可以直接对接SIP网关。
TinySilero与ONNX Silero的性能比较如何?
TinySilero的性能比ONNX Silero快超过2.5倍。
Active-call框架适合什么样的应用场景?
Active-call框架适用于语音通话,支持200路并发,性能稳定。
➡️