💡
原文约2200字/词,阅读约需8分钟。
📝
内容提要
伦敦大学学院、英伟达与班戈大学合作开发的新模型,利用英伟达的Nemotron技术,支持威尔士语及其他英国语言的人工智能推理,旨在改善医疗、教育和法律等公共服务。该项目希望到2050年实现威尔士语百万说话者的目标,促进语言的活跃使用。
🎯
关键要点
- 伦敦大学学院、英伟达与班戈大学合作开发的新模型,利用英伟达的Nemotron技术,支持威尔士语及其他英国语言的人工智能推理。
- 该项目旨在改善医疗、教育和法律等公共服务,促进威尔士语的活跃使用。
- 到2050年,项目希望实现威尔士语百万说话者的目标,称为Cymraeg 2050。
- 新模型将通过Nscale的API向开发者提供,支持公共机构和企业提供双语服务。
- 该模型的开发利用了49亿参数的Llama Nemotron Super模型和9亿参数的Nemotron Nano模型。
- 为了创建足够大的威尔士语训练数据集,团队使用了NVIDIA的微服务进行数据翻译。
- 班戈大学提供语言和文化专业知识,确保模型准确性和处理威尔士语的细微差别。
- 新模型及其数据集将向企业和公共部门开放,支持进一步的研究和应用开发。
- 该项目还计划将相同的方法应用于其他英国少数语言,并与国际合作伙伴合作开发非洲和东南亚的语言模型。
- Nemotron模型和数据可供开发者使用,以构建适用于几乎任何语言的推理模型。
➡️