小红花·文摘

本研究提出了BhasaAnuvaad数据集，涵盖14种印度官方语言，提供超过44,400小时的语音数据，旨在解决自动语音翻译（AST）数据集不足的问题，并评估现有AST系统的缺陷。

巴哈萨阿努瓦德：一个包含14种印度语言的语音翻译数据集

BriefGPT - AI 论文速递 ·

本文探讨了提高低资源语言自动语音翻译质量的方法，研究表明高资源语言的ASR模型训练能有效提升翻译质量。预训练模型的词错误率是关键因素，数据增强与预训练互补。此外，提出了多语言训练的ASR模型，显著提高低资源语言的识别性能，并介绍了新的评价指标和语料库，推动多语言语音识别研究的发展。

规范化中遗失了什么？探索多语言自动语音识别模型评估中的陷阱

BriefGPT - AI 论文速递 ·

本文探讨了提高低资源语言自动语音翻译质量的方法，重点在于利用预训练的ASR模型和数据增强技术。研究表明，伪标签和自训练方法能有效提升语音识别性能，尤其是在资源稀缺的语言中。GigaSpeech 2语料库的引入为低资源语音识别提供了新的研究方向，显著降低了词错误率。

通过大规模伪标签赋能低资源语言ASR

BriefGPT - AI 论文速递 ·

本研究提出了一种新的微调方法，以减轻ASR误差对预训练语言模型的影响，实验结果显示该方法显著提升了口语理解性能。同时，研究探讨了低资源语言的自动语音翻译质量，发现预训练模型的词错误率是关键因素。通过多任务神经网络和后处理模型，进一步提高了ASR质量，并结合大型语言模型技术，改善了特定领域的ASR准确性。

Recorded for Vision, Not Echoed for Hearing: Contextualized Transcription of Automatic Speech Recognition Text

BriefGPT - AI 论文速递 ·

本文探讨了同声传译中的自动语音翻译系统，比较了人类译员与机器翻译的差异，并提出利用大型语言模型（LLMs）进行实时翻译的新方法。研究表明，该方法在翻译质量和延迟方面具有优势，为多语言交流的民主化提供了新思路。同时，介绍了多语言语音文本翻译模型的开发及其性能提升。

通过 LLM 代理实现端到端同时语音翻译的人类水平

BriefGPT - AI 论文速递 ·