💡
原文英文,约1000词,阅读约需4分钟。
📝
内容提要
新西兰的Te Hiku Media使用AI技术保护和振兴毛利人的母语te reo,准确率达到92%。他们建立了Whare Kōrero平台,收录了30多年的毛利人语音资料。该项目激励了其他原住民群体进行类似的AI项目。
🎯
关键要点
- 新西兰的Te Hiku Media使用AI技术保护和振兴毛利人的母语te reo,准确率达到92%。
- Te Hiku Media建立了Whare Kōrero平台,收录了30多年的毛利人语音资料。
- 该项目激励了其他原住民群体进行类似的AI项目。
- Te Hiku Media通过道德和透明的方法收集和分析语音数据,维护毛利人的数据主权。
- 该组织的ASR模型可以将te reo和英语的双语语音转录,准确率为82%。
- Te Hiku Media的目标是促进和振兴te reo Māori,使用NVIDIA的开源技术构建所需工具。
- Whare Kōrero平台现在拥有约1000小时的毛利语母语者的数字化档案材料。
- Te Hiku Media通过众包活动Kōrero Māori收集了超过300小时的标记语音数据。
- Te Hiku Media的ASR模型支持Kaituhi,一个在线的te reo Māori转录服务。
- 该项目的成功激励了其他原住民群体开展类似的ASR项目。
🏷️
标签
➡️