小红花·文摘

阿里达摩院开源了大型语音识别工具包FunASR，核心模型Paraformer经过60,000小时的普通话语音数据训练，具备高精度识别能力。该工具包还包括语音活动检测和文本后处理模型，性能优于Whisper，适用于长音频识别服务。