Whisper-Streaming 是一种基于 Whisper 的实时语音转录和翻译模型,具有 3.3 秒的低延迟。研究提出了 DistilWhisper 方法,通过轻量级微调提升 ASR 性能,并分析了 Whisper 输出,展示了不同训练策略对模型性能的影响,探讨了其在儿童语音上的适应性。所有研究成果和代码已公开。
完成下面两步后,将自动完成登录并继续当前操作。