巴哈萨阿努瓦德:一个包含14种印度语言的语音翻译数据集

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了BhasaAnuvaad数据集,涵盖14种印度官方语言,提供超过44,400小时的语音数据,旨在解决自动语音翻译(AST)数据集不足的问题,并评估现有AST系统的缺陷。

🎯

关键要点

  • 本研究提出了BhasaAnuvaad数据集,涵盖14种印度官方语言。
  • 数据集提供超过44,400小时的语音数据。
  • 旨在解决自动语音翻译(AST)数据集不足的问题。
  • 评估现有AST系统的表现,揭示其在处理自发语音和口语化表达方面的不足。
  • 为低资源印度语言的AST研究提供创新性资源,促进实际应用中的进步。
➡️

继续阅读