本文探讨了土著语言贬值的原因及语言权利立法的必要性,指出外部技术常常适得其反,而社区内部技术则是有效工具。建议在大型语言模型中融入土著知识,以促进知识交流。
本研究探讨了将统一意义表示(UMR)应用于GPT-4提示,以提升低资源语言和土著语言的翻译效果。结果表明,UMR显著改善了翻译性能,显示出其未来应用的潜力。
本文提出了一种轻量级的多语言文本到语音(TTS)模型,旨在解决北美三种土著语言(奥吉布瓦语、米克马克语和马利西特语)语音合成系统不足的问题,强调了多语言模型在数据稀缺情况下的优势。
本研究聚焦于印度尼西亚及其他地区的多种土著语言的语音识别与合成,提出了无监督文本到语音系统和高质量蒙古文TTS数据集等新技术,旨在提升语音合成的自然度与准确性,推动语言保护与复兴。
本文探讨了在澳大利亚为土著语言构建自然语言处理技术时的伦理问题,强调与土著社区互动的重要性。研究指出,技术进步可能导致土著语言的边缘化,呼吁尊重土著观点。通过案例研究,提出了挽救濒危语言的策略,并探讨了AI技术在语言文档化中的应用及其偏见问题。
本文采访了澳大利亚的研究人员,探讨了为土著语言构建NLP技术时的伦理考虑,并建议研究人员关注与土著社区的互动过程。
该研究介绍了针对南美洲土著语言Quechua的ASR语料库,并评估了自监督学习模型在Quechua语和其他6种土著语言上的效果,结果表明自监督学习模型表现出了惊人的性能。
完成下面两步后,将自动完成登录并继续当前操作。