本研究提出了MM-Eval评估数据集,评估大型语言模型在低资源语言(如蒙古语)中的表现。结果表明,模型在句法任务上优于语义任务,知识任务表现适度下降,显示出模型能够将高资源知识迁移至低资源环境。该数据集为低资源语言的自然语言处理提供了重要支持。
本文介绍了一种适用于电子商务应用的生产级代码混合印地语-英语TTS系统的方法。通过利用各种语言的单语数据集,采用以数据为导向的方法,演示了单一脚本双语训练的效果很好。通过对单说话人适应和多说话人训练进行评估,结果显示前一种方法效果更好。结合迁移学习和仅解码器微调来提高性能。与Google TTS进行比较,使用提出的迁移学习方法获得了CMOS分数为0.02。低资源语音适应实验结果表明只需要3小时的数据就可以引入新语音。在大量的领域外纯代码混合句子上进行了主观评估,展示了系统的高质量。
完成下面两步后,将自动完成登录并继续当前操作。