小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

阿里达摩院开源了大型语音识别工具包FunASR,核心模型Paraformer经过60,000小时的普通话语音数据训练,具备高精度识别能力。该工具包还包括语音活动检测和文本后处理模型,性能优于Whisper,适用于长音频识别服务。

funasr语音识别,支持cpu - 乂墨EMO

博客园 - 乂墨EMO
博客园 - 乂墨EMO · 2025-06-29T07:02:00Z
开源上新|FunASR多语言离线文件转写软件包

FunASR是通义实验室开源的语音识别框架,集成语音端点检测、语音识别和标点预测,支持多语言离线转写。其SenseVoiceSmall模型支持中、英、日、粤、韩五种语言,具备语音、语言、情感识别及音频事件检测能力,适用于实时语音交互。FunASR支持Docker部署,提供多种测试方式。

开源上新|FunASR多语言离线文件转写软件包

实时互动网
实时互动网 · 2024-10-21T08:22:15Z

最近在做大模型相关的项目,其中有个模块需要提取在线视频语音为文本并输出给用户。通过调研和实践,成功实现了抓取在线视频、视频转语音和语音转文本的功能。具体实现方案包括使用selenium提取网页中的视频、使用FFmpeg将视频分割为音频文件以及使用funasr进行语音转文本。最终能够在本地电脑实现抓取在线视频并提取视频语音为文本。

Java实现抓取在线视频并提取视频语音为文本

京东科技开发者
京东科技开发者 · 2024-05-22T02:53:10Z
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

阿里达摩院自研的FunAsr是一款中文语音识别技术,与OpenAi的Whisper相媲美。FunAsr基于Paraformer非自回归端到端模型,具有高精度、高效率、便捷部署的优点,支持标点符号识别、低语音识别、音频-视觉语音识别等功能。通过对比测试,FunAsr在中文语音转写方面表现优秀,几乎每一条素材都进行了标注。与Whisper相比,FunAsr的模型参数更多,训练数据更丰富,因此在中文领域的语音识别效果更好。

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

刘悦
刘悦 · 2024-01-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码