💡
原文中文,约1600字,阅读约需4分钟。
📝
内容提要
该项目优化了Silero VAD的推理,性能提升约2.5倍,内存占用降低。引入新playbook,简化语音代理流程,支持SIP和LLM流式输出,适用于语音通话,延迟在800ms以内。
🎯
关键要点
- 该项目优化了Silero VAD的推理,性能提升约2.5倍,内存占用降低。
- 引入新playbook,简化语音代理流程,支持SIP和LLM流式输出。
- 适用于语音通话,延迟在800ms以内。
- 重新手写了Silero VAD的推理,使用纯Rust实现。
- TinySilero的性能比ONNX Silero快超过2.5倍。
- 提供基于markdown的参考方案,简化voice agent的使用。
- 保留了内置SIP支持的Voice-Agent SDK,支持与电话的对接。
- Active-call专注于语音通话,性能良好,支持200路并发。
- 仍然保留Websocket API,允许开发者控制通话。