巴哈萨阿努瓦德:一个包含14种印度语言的语音翻译数据集
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了BhasaAnuvaad数据集,涵盖14种印度官方语言,提供超过44,400小时的语音数据,旨在解决自动语音翻译(AST)数据集不足的问题,并评估现有AST系统的缺陷。
🎯
关键要点
- 本研究提出了BhasaAnuvaad数据集,涵盖14种印度官方语言。
- 数据集提供超过44,400小时的语音数据。
- 旨在解决自动语音翻译(AST)数据集不足的问题。
- 评估现有AST系统的表现,揭示其在处理自发语音和口语化表达方面的不足。
- 为低资源印度语言的AST研究提供创新性资源,促进实际应用中的进步。
➡️