这项研究构建了一个超过500GB的阿拉伯语语料库,提升了大规模语言模型的跨领域知识和泛化能力。研究还改善了阿拉伯方言翻译性能,并提出了ATHAR数据集以解决古典阿拉伯语翻译数据稀缺问题。通过微调大型语言模型,显著提高了翻译质量,强调了定制训练的重要性。
完成下面两步后,将自动完成登录并继续当前操作。