直播间的活跃感难以维持,导致新用户流失和主播冷启动困难。即构科技的AI助手通过实时话术推荐和互动发言推送,帮助主播和观众快速融入,提高互动效率,解决冷场问题。同时,AI助手支持多语种识别,促进国际化交流,提升用户留存和活跃度。
2026年5月12日,ZEGO发布实时互动AI Agent 2.12版本,新增多家ASR厂商和模型,支持中文方言及多语种识别,并引入新加坡节点以降低延迟,满足海外客户需求。同时,新增Round机制,便于追踪对话链路,适用于AI陪聊和智能客服等场景。
百度开源新一代OCR模型PaddleOCR-VL-1.5,实现全球首个“异形框定位”能力,精度达到94.5%。该模型在复杂文档解析中表现优异,支持多语种识别,推动OCR技术应用落地。
本文介绍了LoRA-Whisper模型,通过引入LoRA矩阵,提升多语种自动语音识别性能,减少语言干扰。在八种语言的实验中,LoRA-Whisper在多语种识别和语言扩展上分别提高了18.5%和23.0%。研究还探讨了低秩适应方法在低资源语言和跨语言转移中的应用,显示出良好的性能和适应能力。
完成下面两步后,将自动完成登录并继续当前操作。