WhisperX 是一款开源语音识别项目,具备单词级时间戳和说话人分离功能,使用高效的 whisper large-v2 实现 70 倍实时转录速度,支持多说话人 ASR 和 VAD 预处理,提升识别精度与效率。
完成下面两步后,将自动完成登录并继续当前操作。