小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了BhasaAnuvaad数据集,涵盖14种印度官方语言,提供超过44,400小时的语音数据,旨在解决自动语音翻译(AST)数据集不足的问题,并评估现有AST系统的缺陷。

巴哈萨阿努瓦德:一个包含14种印度语言的语音翻译数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z

本文探讨了提高低资源语言自动语音翻译质量的方法,研究表明高资源语言的ASR模型训练能有效提升翻译质量。预训练模型的词错误率是关键因素,数据增强与预训练互补。此外,提出了多语言训练的ASR模型,显著提高低资源语言的识别性能,并介绍了新的评价指标和语料库,推动多语言语音识别研究的发展。

规范化中遗失了什么?探索多语言自动语音识别模型评估中的陷阱

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

本文探讨了提高低资源语言自动语音翻译质量的方法,重点在于利用预训练的ASR模型和数据增强技术。研究表明,伪标签和自训练方法能有效提升语音识别性能,尤其是在资源稀缺的语言中。GigaSpeech 2语料库的引入为低资源语音识别提供了新的研究方向,显著降低了词错误率。

通过大规模伪标签赋能低资源语言ASR

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本研究提出了一种新的微调方法,以减轻ASR误差对预训练语言模型的影响,实验结果显示该方法显著提升了口语理解性能。同时,研究探讨了低资源语言的自动语音翻译质量,发现预训练模型的词错误率是关键因素。通过多任务神经网络和后处理模型,进一步提高了ASR质量,并结合大型语言模型技术,改善了特定领域的ASR准确性。

Recorded for Vision, Not Echoed for Hearing: Contextualized Transcription of Automatic Speech Recognition Text

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

本文探讨了同声传译中的自动语音翻译系统,比较了人类译员与机器翻译的差异,并提出利用大型语言模型(LLMs)进行实时翻译的新方法。研究表明,该方法在翻译质量和延迟方面具有优势,为多语言交流的民主化提供了新思路。同时,介绍了多语言语音文本翻译模型的开发及其性能提升。

通过 LLM 代理实现端到端同时语音翻译的人类水平

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码