小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了无监督语音识别的预训练方法,通过在大量无标注音频数据上进行特征学习,显著降低了错误率(WER)。研究还提出了改进的 wav2vec-U 2.0 方法和 GraphSpeech 模型,以提升语音识别和文本合成的效果,并使用知识图谱增强对话代理的准确性。

wav2graph:从语音中监督学习知识图谱的框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

本文探讨了多语言预训练模型 wav2vec 2.0 的微调方法,以提升无监督语音识别的音素和单词识别能力。研究表明,通过在 IPA 音素转写上微调,某些语言的单词错误率可低于 20%。此外,KWS-Net 结构在关键词检测上表现优异,且在无音频情况下也能有效工作,展示了无标签语音数据在语音识别中的应用潜力。

零封多语言口语关键词识别的通用语言特征建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-04T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码