小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

阿里达摩院开源了大型语音识别工具包FunASR,核心模型Paraformer经过60,000小时的普通话语音数据训练,具备高精度识别能力。该工具包还包括语音活动检测和文本后处理模型,性能优于Whisper,适用于长音频识别服务。

funasr语音识别,支持cpu - 乂墨EMO

博客园 - 乂墨EMO
博客园 - 乂墨EMO · 2025-06-29T07:02:00Z
开源上新|FunASR多语言离线文件转写软件包

FunASR是通义实验室开源的语音识别框架,集成语音端点检测、语音识别和标点预测,支持多语言离线转写。其SenseVoiceSmall模型支持中、英、日、粤、韩五种语言,具备语音、语言、情感识别及音频事件检测能力,适用于实时语音交互。FunASR支持Docker部署,提供多种测试方式。

开源上新|FunASR多语言离线文件转写软件包

实时互动网
实时互动网 · 2024-10-21T08:22:15Z

最近在做大模型相关的项目,其中有个模块需要提取在线视频语音为文本并输出给用户。通过调研和实践,成功实现了抓取在线视频、视频转语音和语音转文本的功能。具体实现方案包括使用selenium提取网页中的视频、使用FFmpeg将视频分割为音频文件以及使用funasr进行语音转文本。最终能够在本地电脑实现抓取在线视频并提取视频语音为文本。

Java实现抓取在线视频并提取视频语音为文本

京东科技开发者
京东科技开发者 · 2024-05-22T02:53:10Z
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

阿里达摩院自研的FunAsr是一款中文语音识别技术,与OpenAi的Whisper相媲美。FunAsr基于Paraformer非自回归端到端模型,具有高精度、高效率、便捷部署的优点,支持标点符号识别、低语音识别、音频-视觉语音识别等功能。通过对比测试,FunAsr在中文语音转写方面表现优秀,几乎每一条素材都进行了标注。与Whisper相比,FunAsr的模型参数更多,训练数据更丰富,因此在中文领域的语音识别效果更好。

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

刘悦
刘悦 · 2024-01-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码